Gene TM1040_3600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3600
Symbol
ID	4075027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	649135
End bp	650130
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	62%
IMG OID	638005119
Product	oligopeptide/dipeptide ABC transporter, ATP-binding protein-like
Protein accession	YP_611829
Protein GI	99078571
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATA CGCTTCTTTC CGTAAAGAAC CTGACCCTCG ACATTCCCAC CGGCAGCGGC 
ACGCTGCACG CCGTGCGCGG CATCGATTTT GACCTAATGC GCGGCGAGAC CCTCTCTATC 
GTGGGCGAAA GCGGCTCCGG AAAGTCACTG ACCTCGCTGG CTGTCATGGG GCTGTTGGGC 
AAGTCAATCA AACGCCGCGC CGATGAGATG CGGTTTGAAA ACATCGACCT TCTGACGGCG 
AACCGCCGGG TGATGCGCGA TCTGCGCGGC AACCGCATGG CGATGATCTT CCAAGAGCCG 
ATGACATCGC TCAACCCAGC CTACACCATC GGCGATCAGT TGACCGAAAC GCTGCTGCTG 
CATCGCAAGG TCAGCAAGTC TGCCGCTCGC GCGCGGGCCA TTGAGCTGCT TGAAAAGGTC 
GGCATCACCG CAGCCGAGAG CCGCCTGTCG CAATATCCGC ACCAGTTGTC CGGTGGTTTG 
CGTCAGCGGG TGATGATTGC CTTGGCCCTG ATGTGCGAGC CGGACCTGCT GATCGCGGAT 
GAGCCGACGA CCGCGCTGGA TGTGACCATT CAGGCGCAGA TCCTACGTCT CTTGGTCGAC 
CTCACGCGGG AAATGAACAT GGCCATGATC TTGATCACCC ATGATCTCGG CGTGGTGGCG 
CGCGTCGCCG ACAAAGTGGC CGTGATGTAT GCGGGAGAGC TTGTGGAGAC CGGCCCTGCA 
GCGGACGTGT TTGCGACTCC AAGCCATCCC TACACACGCG GACTTTTGCG CTGCATCCCG 
CAACCCGGCA AGACCGAGCG CGGGGCCGCT CTGGGGACCA TTCCGGGCAT CGTGCCGTCC 
CTCATTGGCG AGGTGAGCGG CTGCGCCTTC CGCACCCGCT GCCTGCATGC GCGTCCAGAG 
TGCCGCGCCG ACATTCCCCT TCGAGGCGAA GCAAGCCATG AGTTCAAATG CATTCACCCA 
GACGGGGCTC TATCCCATGA AGGAGAGGCG GTATGA

Protein sequence

MSDTLLSVKN LTLDIPTGSG TLHAVRGIDF DLMRGETLSI VGESGSGKSL TSLAVMGLLG 
KSIKRRADEM RFENIDLLTA NRRVMRDLRG NRMAMIFQEP MTSLNPAYTI GDQLTETLLL 
HRKVSKSAAR ARAIELLEKV GITAAESRLS QYPHQLSGGL RQRVMIALAL MCEPDLLIAD 
EPTTALDVTI QAQILRLLVD LTREMNMAMI LITHDLGVVA RVADKVAVMY AGELVETGPA 
ADVFATPSHP YTRGLLRCIP QPGKTERGAA LGTIPGIVPS LIGEVSGCAF RTRCLHARPE 
CRADIPLRGE ASHEFKCIHP DGALSHEGEA V