Gene TM1040_1981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1981
Symbol
ID	4077165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2084941
End bp	2086053
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	64%
IMG OID	638007296
Product	histidinol-phosphate aminotransferase
Protein accession	YP_613975
Protein GI	99081821
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.413428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGACA GCCGCCAAAC CCCGCTCGCC CAATCCCTGC CCGCTTCGGT GCCCTTTGTT 
GGCCCCGAGA CCCATGAACG CCAGCGCGGC GCGCCTTTTG TGGCGCGGCT CGGTGCAAAT 
GAGAACCTCT TTGGCGTCTC CCCCAAGGCG ATTGCCGCCA TGCAGGCCTC AGCGGCAGAG 
ATCTGGAAAT ACGGCGATGC AGAGAGCTAC GAGCTGCGCG CGGCCCTCTC GGCGTTGCAT 
GGCATTGCAC CCGAACACAT CATGGTTGGC GAGGGCATCG ACGGCCTCCT GGGCAATCTG 
GTGCGGCTTT ATGTCGGCGC CGGCGATGCT GTGGTGACAT CGCTGGGGGC CTATCCGACC 
TTCAACTATC ATGTGGCCGG TTTTGGCGGC GACCTTCACA CTGTGCCCTA CAAGGACGAC 
CACGAAGACA TCAAAGCCCT GATGGCCAAG GCACATGAGG TGGGCGCAAA GCTGGTCTAT 
CTCGCCAATC CTGACAATCC GATGGGCAGT TGGCATCGCG GTGCAGATAT TGTCGCCGCA 
CTTGACGACC TGCCCGAAGG CAGCCTCTTG GTGCTGGATG AGGCCTATGT GGAATGCGCG 
CCCAAAGGCA CCGCCGCCCC GGTCGATGTG ACCGACCCGC GCGTGATCCG CATGCGCACC 
CTCTCCAAGG CCTATGGCAT GGCGGGGGCA CGCGTCGGCT ATGCCATGGG GGCGGTTGAA 
GTCATCTCCG CCTTTCACAA GGTCCGCAAT CACTTTGGCA TGAACCGCTG CGCACAGATC 
GGCGCAACCG AGGCCATCAA GGATCAGGCA TGGCTGGCTC ATGTGCAGGC CGAGATCGCC 
ACCGCACGCG AAGAGATCTC GCGCATCGCT CGCGAAAACG GCCTCACACC GCTGCCTTCC 
GCGACCAACT TCGTCGCCAT AGACTGCGGT CGCGATGGCG CCTTTGCCAA GGCGGTCTTG 
GAGGCGCTGG TGGCGCGGGA CATCTTTGTG CGCATGCCAT TTGCAGCCCC GCAAAACCGC 
TGCATCCGCG TCAGCTGCGG CCCCGAAAGA GAGCGCCGCG CCTTTGCCGA GGCCCTGCCG 
CTGGCCCTCA AAGACGCGCA GAACGGCGCC TAA

Protein sequence

MTDSRQTPLA QSLPASVPFV GPETHERQRG APFVARLGAN ENLFGVSPKA IAAMQASAAE 
IWKYGDAESY ELRAALSALH GIAPEHIMVG EGIDGLLGNL VRLYVGAGDA VVTSLGAYPT 
FNYHVAGFGG DLHTVPYKDD HEDIKALMAK AHEVGAKLVY LANPDNPMGS WHRGADIVAA 
LDDLPEGSLL VLDEAYVECA PKGTAAPVDV TDPRVIRMRT LSKAYGMAGA RVGYAMGAVE 
VISAFHKVRN HFGMNRCAQI GATEAIKDQA WLAHVQAEIA TAREEISRIA RENGLTPLPS 
ATNFVAIDCG RDGAFAKAVL EALVARDIFV RMPFAAPQNR CIRVSCGPER ERRAFAEALP 
LALKDAQNGA