Gene TM1040_1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1140
Symbol	trpD
ID	4078436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1226005
End bp	1227027
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	64%
IMG OID	638006444
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_613135
Protein GI	99080981
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.493316
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATG CGTTGAAACC CCTGATCGGT CTGGCCGCGG ATCGCGCCCT GACCCGAACC 
GAAGCCGAAA CCGCCTTTGC CGCGCTGTTC AATGGCGAAG CCACGCCAAG CCAGATGGGC 
GGTCTTTTGA TGGCCCTGCG CACCCGCGGC GAGACGGTGG ACGAATATGC CGCCGCCGCC 
GCCGTGATGC GTGCAAAATG CAACAAGGTC TCGGCCCCCG CAGATGCGAT GGACATCGTT 
GGCACCGGCG GTGATGGCAA AGGCACGCTC AATATCTCGA CCGCAACCGC CTTTGTGGTT 
GCCGGTGCAG GCGTGCCCGT CGCCAAACAC GGCAACCGCA ACCTGTCGTC CAAATCCGGC 
GCCGCAGATG CGCTCACCGA GATGGGCATT CAGGTCATGG TTGGCCCGAA AGTGGTCGAA 
AAGTCCCTCA AAGAGGCGGG CATCTGTTTC ATGATGGCGC CCATGCATCA CCCGGCAATC 
GCCCATGTGA TGCCCACCCG TCAGGAGCTT GGCACGCGGA CGATTTTCAA CATCCTCGGC 
CCGCTCACCA ACCCCGCAGA TGTCAAACGC CAACTCACCG GTGCCTTCAG CCGTGACCTG 
ATCCGACCGA TGGCGGAGAC GCTGAAACAG CTCGGCTCCG AGGTCGCATG GCTGGTGCAT 
GGCTCTGACG GGACTGATGA GCTCACGATC ACGGGTGTCA GCTGGGTTGC GGGTCTCTCG 
GAGGATGGCA ACATCTCCGA ATTCGAGGTC CACCCCGAAG AGGCAGGCCT GCCGGAGCAT 
CCTTTTGAGG CCATCGTCGG TGGCACGCCC GCCGAGAACG CCGCCGCCTT CCGCGCCCTC 
CTCGAAGGCA CGCCCTCGGC CTACCGGGAT GCGGTGCTTT TGAACTCTGC CGCAGCACTC 
AAGGTGGCCG GCGTGGTGTC GTCGCTCAAG GAGGGCGCGG AACGCGCTGC CGAAAGCATC 
GACAGCGGTG CCGCTCTGGG CAAGGTGACG GCGGTTGCAC GGATCACGTC GGAGGCCAGC 
TGA

Protein sequence

MSDALKPLIG LAADRALTRT EAETAFAALF NGEATPSQMG GLLMALRTRG ETVDEYAAAA 
AVMRAKCNKV SAPADAMDIV GTGGDGKGTL NISTATAFVV AGAGVPVAKH GNRNLSSKSG 
AADALTEMGI QVMVGPKVVE KSLKEAGICF MMAPMHHPAI AHVMPTRQEL GTRTIFNILG 
PLTNPADVKR QLTGAFSRDL IRPMAETLKQ LGSEVAWLVH GSDGTDELTI TGVSWVAGLS 
EDGNISEFEV HPEEAGLPEH PFEAIVGGTP AENAAAFRAL LEGTPSAYRD AVLLNSAAAL 
KVAGVVSSLK EGAERAAESI DSGAALGKVT AVARITSEAS