Gene Franean1_7207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7207
Symbol
ID	5675508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8799955
End bp	8801055
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	74%
IMG OID	641246044
Product	Glu/Leu/Phe/Val dehydrogenase dimerisation region
Protein accession	YP_001511432
Protein GI	158318924
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0334] Glutamate dehydrogenase/leucine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0169486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCGG TGGTCGACAC GTCCACGGGA GTCTCGTCGG TGTTCGAGGC CGGCGCGGAG 
CACGAGCAGG TGGTGTTCTG CTCCGATCGG GCCAGTGGCC TGCGCGCCGT GATCGCCATC 
TACTCGACCG CGCTGGGGCC GGCGCTGGGA GGCACCCGGT TCCACGCCTA TCCGGACGAG 
GCGTCCGCAC TAGCCGACGC CCTCGCGCTC TCCCGCGCGA TGGCCTACAA GGCCGCCTGC 
GCGGGCCTGG ACCTCGGCGG CGGCAAGGCC GTCATCCTGG GCGACCCCGC CCGCGACAAG 
ACCGAGGCGC TGCTGCGCGC CTACGGGCGC TTCATCGCCT CGCTGGGCGG CCGCTACGTG 
ACGGCCTGCG ACGTCGGGAC GTACGTCGAG GACATGGACA CCATCGCCAG GGAGACCCGT 
TGGGTCACCG GCCGCTCGCC GGCGCACGGC GGCTCGGGCG ACTCCGGCGT CCTGACCGCG 
TACGGCGTCT TCGAGGGGAT GCGCGCCTGC GCCCGGCACC GATGGGGGAC ACCCTCGCTC 
GCCGGGCGCC GGGTCGCCGT CAGCGGGGTC GGCAAGGTCG GCCTGCGCCT CGTGGGGCAC 
CTGGTGGAGG AGGGGGCGAC CGTTCTGGCC GGGGATACCG ATCCGGGCGC CCTGCGGCGA 
CTGGGAGCCC GCCATCCCGA CGTCCAGCTG GTGGCCGACC CCGACGAGCT CCTCCGGGCC 
GAGGTCGACA TCTACGCGCC CTGCGCGCTG GGCGGGGTGC TCACCGACGA GGTCGTGCCC 
GCGCTGCGGG CGGAGATCAT CTGCGGCGGG GCGAACAACC AGCTGGCCCA CCCGGGCATG 
GACAAGGTCC TGGCCGACGC GGGCGTGCTG TACGCGCCCG ACTTCGTGGT CAACGCCGGC 
GGACTGATCC AGGTGGCGGA CGAGATCGAG GGGTACTCCC CGGAACGGGC CAGGGCCCGG 
GCCGCCCGGA TCTTCGACAC GGCGCTGGAC ATCTTCCGGC TCGCCGAGGC GGAGGGCGCC 
ACCCCGGCGG TGGCGGCGGG ACGCTTCGCC GAGCGCCGGA TGACCGACAT CGGCCGGCTG 
CGGGGCATCC TGCTGCCCTG A

Protein sequence

MSAVVDTSTG VSSVFEAGAE HEQVVFCSDR ASGLRAVIAI YSTALGPALG GTRFHAYPDE 
ASALADALAL SRAMAYKAAC AGLDLGGGKA VILGDPARDK TEALLRAYGR FIASLGGRYV 
TACDVGTYVE DMDTIARETR WVTGRSPAHG GSGDSGVLTA YGVFEGMRAC ARHRWGTPSL 
AGRRVAVSGV GKVGLRLVGH LVEEGATVLA GDTDPGALRR LGARHPDVQL VADPDELLRA 
EVDIYAPCAL GGVLTDEVVP ALRAEIICGG ANNQLAHPGM DKVLADAGVL YAPDFVVNAG 
GLIQVADEIE GYSPERARAR AARIFDTALD IFRLAEAEGA TPAVAAGRFA ERRMTDIGRL 
RGILLP