Gene TM1040_0633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0633
Symbol
ID	4076120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	675784
End bp	676980
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	63%
IMG OID	638005930
Product	aminodeoxychorismate synthase
Protein accession	YP_612628
Protein GI	99080474
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.284846
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGTCGA AACCGCTATA TGCGGGGCAA GGGAGACACT CACTGCTCAC GGAGACCCTG 
CCGGTGGAAA TCCGCTTTGA CAATGGCCCA TCGAAGGGCG CGGCGCTGTT TGAAGACCCA 
GTTGACCTGA TCCGCGCGCA AGACCCGGAT GAGGTGCAGG GGGCGCTTGC GGCCTTGGAC 
CGCGCCCGCG CCGAGGGGCA TTGGGTTGCA GGCTATGCGT CTTATGAGTT GGGCTATGCG 
CTTGAGCCAC GTTTGGCGCA TCTTCTGAAT GGGCGCGGGC ACCGGCGTCT TCCGTTGCTG 
CAGTTCGGTG TGTTCCGCGC GCCGGTGGCG GCGGATGTTC CGCTTTGGGC TGGGGATGCA 
GGTGTGGGAG AGACGACCGC GCGCTGGGAC GCTGCCCGCT ACACCGAGGC CTTTGATCGC 
GTTAAATCCT ACATTGGCGC CGGCGACATA TATCAGGCCA ATCTGACTTT CCCCATCGAC 
GCACAGGTCT GGGGCGGGGC GGAGGCGCTT TATGCGGCCC TTGCCGCGCG TCAGCCTGTG 
GGCCACGGGG CGCTTGTGCG TCAGGACGGG CTGCCAACGA TCCTGTCGCG CAGCCCGGAG 
CTCTTCTTTC GCACATCCTC GGATGGGGTG ATCGAGACGC GTCCCATGAA GGGCACGCAA 
CCGCGCAGCC TTGACCCGCG AGAGGATTCG CGACGACGGG ATTTCCTGCG CTCTGACGAA 
AAGAACCGCG CTGAAAACCT GATGATTGTC GACCTTCTGC GCAATGACAT CAGCCGCGTG 
TCCGAGACCG GCTCGGTCCA TGTGCCAGAG CTGTTTGCCG TGGAAAGCTA TGCGACGGTG 
CACCAGATGG TGTCATTGGT GCGGGCACGC CTCAAGGCCG GCTGCGGTCT GGCGGACATC 
TTTGCGGCAC TTTATCCCTG CGGGTCGATC ACCGGCGCGC CCAAAATCCG TGCCATGGAG 
ATCCTTGCGG AACTCGAGCC CGGGGCGCGC GACATTTATT GCGGCACCAT TGGCTGGGCG 
GCCCCCGACG GGCGGTCGGA ATTCAATGTC TCCATACGTA CGATGATGCT GGAGGGCGAT 
GCGGCCACGT TCAACGTCGG CGGTGGGCTG GTCTGGGACA GCACCTCCGC CTCCGAGTAT 
GAGGAAGCGC TGTGGAAAGC CCGTTTTGCA CAAGTGACGA CCCCGATTTC CGCTTGA

Protein sequence

MASKPLYAGQ GRHSLLTETL PVEIRFDNGP SKGAALFEDP VDLIRAQDPD EVQGALAALD 
RARAEGHWVA GYASYELGYA LEPRLAHLLN GRGHRRLPLL QFGVFRAPVA ADVPLWAGDA 
GVGETTARWD AARYTEAFDR VKSYIGAGDI YQANLTFPID AQVWGGAEAL YAALAARQPV 
GHGALVRQDG LPTILSRSPE LFFRTSSDGV IETRPMKGTQ PRSLDPREDS RRRDFLRSDE 
KNRAENLMIV DLLRNDISRV SETGSVHVPE LFAVESYATV HQMVSLVRAR LKAGCGLADI 
FAALYPCGSI TGAPKIRAME ILAELEPGAR DIYCGTIGWA APDGRSEFNV SIRTMMLEGD 
AATFNVGGGL VWDSTSASEY EEALWKARFA QVTTPISA