Gene Franean1_6217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6217
Symbol
ID	5674536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7550546
End bp	7551580
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	69%
IMG OID	641245069
Product	alcohol dehydrogenase
Protein accession	YP_001510465
Protein GI	158317957
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.51495
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGGG CCATCGTTTT CAACGGCGAC GAGACCTGGG AGGAACGCGA TCTGCCGGTG 
CCCGATCCCC AGCCGGGCGG AGCTGTCCTT CGGGTGGAGG CGACCGGCCT CTGCCACAGC 
GATATCGACC ATTTCCGGGG TCATGTGCAC ACGTCCTGGG GCGGTGCGTT CCCGTCCATC 
GCCGGTCACG AGATCGTGGG CCGGGTGGAG AAGATCGACG CCGCGGCGGC CGCCGCGTGG 
GGCGTCGGGG AAGGTGACCG GGTCGCCGTC CGCGACATCG TGGTGACCCC CGCCGGTTAC 
CGCATCTACG GGCACGACTT CTCCGTGGAC GAGGGCTCCG GCCTGCATGG CGGATTCGCG 
GAGCACCTCG AACTGCTGCC CGGTTCCCGG GTGTATCGCC TGCGTGACGA TCTCCCGGCC 
GAGGAGCTCA CGGTCTTCGA GCCACTGAGC TGCGCGGTGA CCTGGGTGGC GCCGGTGCGG 
CAGGACGATG TCGTGATCAT CGAAGGTCCC GGCCACATGG GCATGGCCAC CATCGTCGCT 
GCCCGCGCGG CCGGAGCCGC CACGGTGATC GTGACCGGGA CGGCGAGCGA CAGATTCCGC 
CTCGACTGGG CGCTGCGTGT CGGTGCCGAC CACACCGTCG ACGTCGACAA CGAGGACCCG 
GTCGAACGAG TACACGAGAT CACCGACGGC CGGATGGCGG ACGTGGTGAT CGACGCCGCG 
GCGGGAAATC CGGTGACGGT GAACCTTGCC ATGGATCTCG TGCACAAGGG TGGGCATGTC 
GTCGTCGCCG GTATGAAGGA CGGCCCGCTC AAGGGCTTCC ACAGCGACTG GATCCCTACC 
CGACGGATCA CCCTCCACCC CGGCGCGGGC CTCGACACGG AAGGAGCGGT CGAGCTCATC 
AACGCCGGCC GGGTACCGAC CGCCGACCTG CTCGGCGACA CCTTCCCCCT CGAACGTTTC 
GAGGAGGCGT TCGCCCTCCT GTCACGAAGG ACACCGGGCC ACGATTCGAT CCGGGTCGCC 
CTGCGCCTGT GCTGA

Protein sequence

MSRAIVFNGD ETWEERDLPV PDPQPGGAVL RVEATGLCHS DIDHFRGHVH TSWGGAFPSI 
AGHEIVGRVE KIDAAAAAAW GVGEGDRVAV RDIVVTPAGY RIYGHDFSVD EGSGLHGGFA 
EHLELLPGSR VYRLRDDLPA EELTVFEPLS CAVTWVAPVR QDDVVIIEGP GHMGMATIVA 
ARAAGAATVI VTGTASDRFR LDWALRVGAD HTVDVDNEDP VERVHEITDG RMADVVIDAA 
AGNPVTVNLA MDLVHKGGHV VVAGMKDGPL KGFHSDWIPT RRITLHPGAG LDTEGAVELI 
NAGRVPTADL LGDTFPLERF EEAFALLSRR TPGHDSIRVA LRLC