Gene Franean1_1006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1006
Symbol
ID	5669420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1186838
End bp	1187962
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	73%
IMG OID	641239935
Product	threonine synthase
Protein accession	YP_001505368
Protein GI	158312860
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGA TGTCGTCGAT GCCGGTTTCG AGCGACCCGG CCGGCAGCAG TGCCCCCGAG 
CGCGCGTCGC GGGCCTGGCG GGGGATCATC GAGGAGTACC GGGACCGGCT GCCCGTCACC 
GCCGACACAC CGGTGATCAC CCTGCGGGAG GGCGGCACCC CGCTGCTGCA CGCGGACCAT 
CTGTCCGAGC TGACCGGATG TGATGTTCAT CTCAAGGTCG AAGGTGCCAA CCCCACCGGC 
TCGTTCAAGG ACCGCGGCAT GACGGTCGCG ATCAGCCGGG CGGTGGGAGA GGGCTCCCAG 
GCCGTCATCT GCGCGTCCAC CGGCAATACC TCGGCCTCGG CCGCGGCGTA CGCCGCCCGC 
GCCGGGCTGA CCTGCGCGGT GCTGGTTCCC AGCGGCAAGA TCGCCCTCGG CAAGCTCGCG 
CAGGCCCTGG TGCACGGCGC GCGCCTGCTC CAGGTGGAGG GGTCGTTCGA CGACTGCCTC 
CGGGTCGCCC GCGAGCTGGC CGACACGTTC CCGGTCACGC TGGTGAACTC GGTCAACCCG 
CACCGCCTGG AGGGGCAGAA GACCGCCGCC TTCGAGATCG TCGAGGCGCT CGGCCACGCG 
CCCGACGTGC ACTGCCTGCC GGTCGGGAAC GCGGGTAACA TCACCGCCTA CTGGCGCGGC 
TACGTCGAGG AGGACACCCG GATCCGGTCC GGCCGGCCGC GGATGTTCGG GTTCCAGGCG 
GCGGGCGCGG CGCCGATCGT GCGGGGCGAG GTGGTGACCT CGCCGCAGAC CATCGCCACG 
GCCATCCGCA TCGGCAACCC GGCCTCCTGG GATTTCGCGA CCGACGCGCG GGACGCCTCC 
GGCGGTCTGA TCGACGCGGT CAACGACCGG CAGATCCTGG CCGCCTACCG GCTGCTGGCG 
CGCCGCGAGG GCGTCTTCGT CGAGCCGTCC AGTGCCGCCA GCGTCGCCGG GCTGCTCGCC 
ACGTACGCCG ACGGCCGGCT GAGCCCGGGC CAGCGGGTCG TCTGCACCGT CACCGGCAAC 
GGGCTGAAGG ACCCGGACTG GGCCATCAGC GGCGCGGCGA AGCCCGAGAC CATCCCGCCG 
ACCGTGGCCG GCGCCGCCAG GGCCCTCGGC CTGCAGCGGT CGTGA

Protein sequence

MTTMSSMPVS SDPAGSSAPE RASRAWRGII EEYRDRLPVT ADTPVITLRE GGTPLLHADH 
LSELTGCDVH LKVEGANPTG SFKDRGMTVA ISRAVGEGSQ AVICASTGNT SASAAAYAAR 
AGLTCAVLVP SGKIALGKLA QALVHGARLL QVEGSFDDCL RVARELADTF PVTLVNSVNP 
HRLEGQKTAA FEIVEALGHA PDVHCLPVGN AGNITAYWRG YVEEDTRIRS GRPRMFGFQA 
AGAAPIVRGE VVTSPQTIAT AIRIGNPASW DFATDARDAS GGLIDAVNDR QILAAYRLLA 
RREGVFVEPS SAASVAGLLA TYADGRLSPG QRVVCTVTGN GLKDPDWAIS GAAKPETIPP 
TVAGAARALG LQRS