Gene TM1040_3140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3140
Symbol
ID	4075012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	118725
End bp	119699
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	63%
IMG OID	638004643
Product	oligopeptide/dipeptide ABC transporter, ATP-binding protein-like
Protein accession	YP_611376
Protein GI	99078118
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.141396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACC CTGTTCTGTC CATCCGCAAC CTTTGTGTGG AAATCCCGAC CCGCCACGGC 
ATCCTGAAAC CGGTCGATGG CGTCTCTTAT GACATTGCCA AGGGCGAAAT CCTTGGCATC 
GTTGGCGAAA GTGGCGCCGG CAAGTCGATG GCGGGCAATG CCGTCATTGG TCTCCTGAAC 
CCGCCGGCGC ATGTGTCTTC CGGTGAGATC TGGCTCAACG GCAAACGTAT CGACACCCTG 
AAAGGGGACG CGCTGCGCCG CCTGCGGGGC AAGGAAATCG GTATGGTCTT TCAGGACCCA 
CTGACCTCCA TCAATCCGCT GTTGCGGATC GGGGATCAAC TGGTGGAGAC CATGCTGACC 
CACCTGCCGA TCAGCAAATC CGAGGCCGAA AAACGCGCCG TGGCCGCCCT AGAAGAAGTG 
GGCATTCCCG GTGCTGCGAA ACGTGTGAAC AGCTACCCGC ACGAGTTTTC CGGCGGTATG 
CGCCAGCGGG TGGTGATCGC CTTGGCGCTT TGTGCGGAGC CTTCGCTGGT CATCGCGGAT 
GAGCCGACAA CGGCGCTGGA TGTGTCTGTG CAGGCACAGA TCATCGCGTT GCTGAAACGG 
CTCTGTCGTG AGCGCGGCAC GGCTGTCATG CTGATCACGC ACGACATGGG CGTGATTGCC 
GAAGCAGCAG ATCGTGTGGC GGTGATGTAT GCCGGGCGCC TCGCAGAGCT CGGCCCGGTG 
CGCGATGTGA TCACCGCGCC TGAGCACCCC TATACGCATG GGCTGATGGC CTCGACACCA 
CTCGCGTCGC GTGGCCAGAA ACGTCTGCAC CAGATCCCCG GCGCAATGCC GCGTCTGGAT 
GCGGTGCCGG ATGGTTGCGC CTTCAACCCA CGCTGCCCGC ATGCGGCCGA CAAATGCCGC 
GCGGCCCCCG CACCCAAGGT CGACGGAGGT TCCGCCGCGT GCTGGTTCCC ACTTCAACAT 
GAGGAGGCCT CCTGA

Protein sequence

MADPVLSIRN LCVEIPTRHG ILKPVDGVSY DIAKGEILGI VGESGAGKSM AGNAVIGLLN 
PPAHVSSGEI WLNGKRIDTL KGDALRRLRG KEIGMVFQDP LTSINPLLRI GDQLVETMLT 
HLPISKSEAE KRAVAALEEV GIPGAAKRVN SYPHEFSGGM RQRVVIALAL CAEPSLVIAD 
EPTTALDVSV QAQIIALLKR LCRERGTAVM LITHDMGVIA EAADRVAVMY AGRLAELGPV 
RDVITAPEHP YTHGLMASTP LASRGQKRLH QIPGAMPRLD AVPDGCAFNP RCPHAADKCR 
AAPAPKVDGG SAACWFPLQH EEAS