Gene Franean1_3198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3198
Symbol
ID	5671574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3777263
End bp	3778729
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	74%
IMG OID	641242092
Product	mannitol dehydrogenase domain-containing protein
Protein accession	YP_001507512
Protein GI	158315004
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0246] Mannitol-1-phosphate/altronate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.247953
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCATT CCGCGGCCGT GCCTGTGAAC CGCCCAGTGG CGGCGCCCGC CAGCGGCCCC 
GTGGCCCCGT CGCCGAGTCG TCCTGCGGCT GTCGCTCGAC CGCTGTCGCG GCCCGGTGGC 
GACGGGCGGC CGGCGGCTCG GGTTCGCATT CTGCATCTCG GGCTCGGTAG CTTCTTCCGG 
GCCCATCAGG CCTGGTACAC CGACCGGGCG CCGGACGCCC GGCAGTGGGG GATCGCGGCG 
TTCTCCCACC GCCGCCGGGG CCTCGCGCAC GCGCTGACCG CCCAGGACGG GCTCTACACC 
CTGCTGACGC GCGGTGCCGA AGGCGACCGC TTCGACGTGA TCAGCTCGCT TGCCGCCGCG 
CACGCGGGCA GCGACCACGA CGCCTGGCTG GCGTACTGGC GGCAGCCGGC CCTCGCCGTC 
GTCACCCTGA CGGTCACGGA GGCCGGTTAC GCCTGTGACC CCGACGGAGG TCTCGACCTG 
GCGCGCGGGG ACGTCGCCGC CGACATCGCG GCGCTGCGCA CCGACCCCGG CGCCCTGGTG 
ATGACGGCTC CCGCCCGCCT GCTCGCCGGA CTGCACGCGC GGGCCCGGGC CGGCCGCAGT 
CCGGTCGCGA CAGTGCCGTG CGACAACCTG GCGGGCAACG GCGCTGTGGC CGGGCGCGCG 
GTACGCGAGC TGGCCGCGGC GACCGGACGA CCGGAGCTCG TCGCCGCCGC GGACGGCGCC 
TCGTGGGTGA CCACGATGGT CGACCGCATC ACCCCGGGCA CCACCGACGC CGACGGCGCC 
GCGGTGCGCG CCGCGACCGG CCGCGACGAC GCCGTGCCGG TGGTCACCGA GCCGTTCTCG 
GAATGGGTGC TCAGCGGTGA CTTCCCGGGT GGGCGGCCCG AGTGGGAACA CGCGGGTGCC 
CGGTTCGTCG CCGACCTGAC GCCGTTCGAG AACCGCAAGC TGTGGCTGCT CAACGGCGCG 
CATTCACTGC TGGCCTACGC CGGTCCCCGC CGCGGGCACG TCACGGTCGC GCAGGCCGTC 
GCCGACCCCC GCTGCCGCGG GTGGCTGATC GAGTGGTGGG CGGAAGCCTC CCGCCACCTG 
AGCATGACCA GGACCGAGCT CGAGTCCTAT CAGCATGCGT TGCTGGAACG CTTCGAGAAC 
CCGCGGATTC GGCATCTGCT CGCTCAGATC GCCATGGATG GCTCTCTGAA GCTTCCGGTG 
CGTATCCTGC CGGTCCTGCG CGCTGAACGT GCCCGCGGCG TGATGCCCCG GGCCGGAATC 
CGAGTGATCG CCGCCTGGAT GCTGCATCTG CGGGAGGGGA CGGCGTCGGT ACGCGATGCT 
GAGGCGGGCC GGTCGGTCGC CGCGGCCCGG GCTCCGCTGC CCGAAGCCGC CAGCCTGGTC 
CTCGATCTTC TCGGCCCCGG ACTGGGCCGG GACGGGGAGC TGGTGGCGGC GTTGGCCGCA 
CAGGTGACCG AGCTGGGCGA TCCCTGA

Protein sequence

MNHSAAVPVN RPVAAPASGP VAPSPSRPAA VARPLSRPGG DGRPAARVRI LHLGLGSFFR 
AHQAWYTDRA PDARQWGIAA FSHRRRGLAH ALTAQDGLYT LLTRGAEGDR FDVISSLAAA 
HAGSDHDAWL AYWRQPALAV VTLTVTEAGY ACDPDGGLDL ARGDVAADIA ALRTDPGALV 
MTAPARLLAG LHARARAGRS PVATVPCDNL AGNGAVAGRA VRELAAATGR PELVAAADGA 
SWVTTMVDRI TPGTTDADGA AVRAATGRDD AVPVVTEPFS EWVLSGDFPG GRPEWEHAGA 
RFVADLTPFE NRKLWLLNGA HSLLAYAGPR RGHVTVAQAV ADPRCRGWLI EWWAEASRHL 
SMTRTELESY QHALLERFEN PRIRHLLAQI AMDGSLKLPV RILPVLRAER ARGVMPRAGI 
RVIAAWMLHL REGTASVRDA EAGRSVAAAR APLPEAASLV LDLLGPGLGR DGELVAALAA 
QVTELGDP