Gene Franean1_3672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3672
Symbol
ID	5672038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4347927
End bp	4348898
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	77%
IMG OID	641242555
Product	alcohol dehydrogenase
Protein accession	YP_001507975
Protein GI	158315467
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCAC TTGTGACGGA CGGGTCGGCG GCCGGCGGGC TGCGGCTTGG GGAGGTGCCC 
GATCCGGTAC CCGGGCCCGA CCAGGTGCTG ATCAGAACGG CGGCGATCTC GCTGGTCGAC 
CGCGACACGG GCTATGCCGC GGCGATGCTC GGCGACGGCG GAGTCTGGGG GTTCGACGCG 
GCGGGTGTGG TCGTCGAGGC CGCAGCTGAC GGGAGTGGCC CGCCGGTGGG GTCGACGGTG 
CTCACCCTGC TGCCGGCGCC CGGGGCCTGG GCGGAGCTCG TCACCGCCAG CACCGGTGAC 
GTTGCCATGC TGCCGCCGGG TGTGGATCCG GGCGTGCTGA CTGGGCTCGC GCTGCCGGCG 
GTCTCCGCGG TGCAGGCCCT CGGTGAGGTC GAGGGGCTCG CCGGCAGCCG CGTCCTCGTC 
ACCGGCGCCG GTGCCGGCGT GGGCTGGTTC GCCGTTCAGT TGGCCGCGCT GCGCGGGGCC 
GAGGTCGTCG CCGTGGCGCG CGATCCCGCG GACGCCGACG ACCTGCGGGC GGCCGGCGCC 
CACGAGGTCC GCACCGAGCT GCCGGCGACG GATCCGGGTG ACCCGGTCGG GGGCGATCCG 
GCCACGGCTG AGCCAGCCGC GTCGTTGCGG CCGGTGGACG TGGTGGTCGA CGTGGTGGGC 
GGGTCGACGA TGACCCGGGC GGTCGACCTG CTGGCGGAGG GCGGCACCGC CCTCGCGGTC 
GGCGCGATCT CCGGGGAGCG GATGGTCTTC CCGCCGGCGG CCTTCGCGAG CCCGCTGCGC 
CGACGTGTCC GCGGGTTCTG GGGCAGCTGG CCGGTCGGCG GCGACCTGGC CACGGTCGTC 
GAGCTGGTCG CCGCCGGGCG GCTGTGCCCA CGGCCGGGCT GGCGCGGTGG CTGGGGTGAG 
GTCACGGGTC TGCTCGAGAG CTTCGCCGCC GGCCGGACCC GGCGCCGCCG GGCCGTGCTC 
GACGTCGTCT GA

Protein sequence

MRALVTDGSA AGGLRLGEVP DPVPGPDQVL IRTAAISLVD RDTGYAAAML GDGGVWGFDA 
AGVVVEAAAD GSGPPVGSTV LTLLPAPGAW AELVTASTGD VAMLPPGVDP GVLTGLALPA 
VSAVQALGEV EGLAGSRVLV TGAGAGVGWF AVQLAALRGA EVVAVARDPA DADDLRAAGA 
HEVRTELPAT DPGDPVGGDP ATAEPAASLR PVDVVVDVVG GSTMTRAVDL LAEGGTALAV 
GAISGERMVF PPAAFASPLR RRVRGFWGSW PVGGDLATVV ELVAAGRLCP RPGWRGGWGE 
VTGLLESFAA GRTRRRRAVL DVV