Gene Francci3_2240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2240
Symbol
ID	3905008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2612561
End bp	2613628
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	65%
IMG OID	637879571
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_481337
Protein GI	86740937
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0360217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCCA CCATGCAGGC ACTGGCGTTT CTCGGCATCG GCAAGGCCGG CGTCATCGAG 
AAGCCCATAC CGAAGCCAGG GCCAACTGAC GCGATCGTAC GGACAACATC GGCGCTTATC 
TGCACCTCCG ATGTGCACAC CGTCCGGGGC GCCATTCCCG TTCCCGAAGG CCGCGCTCTC 
GGGCACGAGG CGGTCGGTGT CGTCCACGAC CTGGGCGCCG CGGTCACTGG ATTCGAGGCC 
GGTGAGCGGG TAGCGGTCGG GGCGCTTACG CCGTGCTTTC ACTGCGGCCC CTGCCAGCGG 
GGTTTCAGTA CCCAGTGCCA GGGAATGCTC GGTGGGTACA AATTCACCAC GCAGCGCGAT 
GGCAACATGG CGGAGTACTT TCTCGTCAAC AATGCGGCCG CCAACCTCGC TCGCATTCCG 
GCCGACCTGC CCGACGAGAA AGCCGTCTAC GCGACCGACA TGCTCTCCAC CGGGTTCGGT 
GGCGCGGAGA ACGCGCAGCT GCGGCTCGGT GAGTCCGTCG CGATCTTCGC TCAGGGGCCG 
GTAGGGTTAT CCGCCACCAT CGGCTGCCGG CTGCTCGGCG CCGGACTGAT CATCGCCGTG 
GAAGGACGGC CCGAACGGCA GGAGCTGGCA CGTCGATTCG GCGCGGACGT GGTCGTCGAC 
CCCGCCGCTG GTGATGTGGT GAACCAGATC CTCGATCTCA CCGGCGGCGT CGGCGTGGAC 
GGCGCGATCG AGGCGCTCGG TCATCCGCAG ACCTTCGAGG ACTGCATCCG GGTGACCAAA 
CCCGGTGGCC GGATATCGAA TATCGGGTAT CACGGTGAGA ACCCGGCACC GCTGCAGATC 
CCGTTGGAAC CGTTCGGCCT GGGTATGTCG GACAAGAAGA TCCTGACGTC GCTCTGCCCA 
GGCGGAAGCG ATCGGCTCGA GCGAATCTTC ACCCTCATGC GTTCCGGCCG GGTGGATCCT 
ACGCCGATGA CGACCCATGA GTTCGGGTTC GACGAGATCG AACGTGCCTT CAGCATGATG 
GAAACCAAGG AGGACGGCGT CATCAAACCC CTCATCCGTT TCGCATAA

Protein sequence

MPATMQALAF LGIGKAGVIE KPIPKPGPTD AIVRTTSALI CTSDVHTVRG AIPVPEGRAL 
GHEAVGVVHD LGAAVTGFEA GERVAVGALT PCFHCGPCQR GFSTQCQGML GGYKFTTQRD 
GNMAEYFLVN NAAANLARIP ADLPDEKAVY ATDMLSTGFG GAENAQLRLG ESVAIFAQGP 
VGLSATIGCR LLGAGLIIAV EGRPERQELA RRFGADVVVD PAAGDVVNQI LDLTGGVGVD 
GAIEALGHPQ TFEDCIRVTK PGGRISNIGY HGENPAPLQI PLEPFGLGMS DKKILTSLCP 
GGSDRLERIF TLMRSGRVDP TPMTTHEFGF DEIERAFSMM ETKEDGVIKP LIRFA