Gene TM1040_2251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2251
Symbol
ID	4077318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2365793
End bp	2366992
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	63%
IMG OID	638007573
Product	putative ABC transporter solute-binding protein
Protein accession	YP_614245
Protein GI	99082091
COG category	[R] General function prediction only
COG ID	[COG4134] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.11793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGCA TCTTGTCCCT TGCCCTCGCC CTTGCGCCGC TTTCGGCCTG GGCCACACCC 
GATCCGGCGG ATTGGCCCGC CGTGGTGGAA GATGCAAAAG GGCAGACGGT GCATTGGCAT 
GCCTGGGGCG GCTCCACCGC GACCAATGAC TTTATCGCCT GGGTGGGCGA ACGTCTTGAG 
GACGACTACG ACATCACCCT CAACCATGTG AAACTCGAAA GCACCGCCGA TGCGGTCACG 
CGGGTGCTGA CCGAGAAATC CGCGGGCCAG GATGACGATG GCGCGGTGGA TCTCATCTGG 
ATCAACGGGG CGAATTTCGC CGCGATGAAG GACGCCGATC TGTTGTTTGG CCCCTTTGCC 
GAGGCCCTGC CCAACTGGCA GCTGGCCGAC ACCGAAAACA AGACGCTGCA GCATGATTTC 
ACCGTCCCCA CCGAAGGCTA CGAGTCCCCA TGGGCGATGG CGCAGGTGGT CTTCATGCAT 
GACACCGCCG ACCTGCCCGA GCGGCTTGGC TCGATGGAGG CGCTGTTGGA CTGGGCGCGC 
GAACATCCCG GTCGCTTCAC CTATCCGCAG CCCCCGGATT TCCTCGGCAC CACCTTTCTG 
AAACAGGCAC TGGTTGACCT GAGCGACAAT GCCGATGCGC TGTCCAAGCC CGTGAATGAA 
GACAACTACC AAGAGGTCAC TGCCCCGCTC TGGGCCTTTC TCGAAGAGCT GACGCCGCTG 
TTGTGGCGCG AGGGGCGCGC CTATCCCGCC ACTGGCCCGC GTCAGCTGCA GTTGATGAAT 
GACGACGAGA TTGATCTCGC GATCTCTTTC AGCCCCGGCG AAGCGAGCAC CGCCATCGCC 
AACTACCAGC TGCCCGAAAG CGTGCGCACC TTCGTGCTCG ACAAGGGCAC GATCGGCAAT 
GCATCCTTTG TGGCGATCCC CTATAATTCC GGCTCCAAGG CGGCCTCCAT GGTGGTTGCG 
AACTTCCTGA TGTCGCCCGA GGCCCAACTG CGCGCCCAGG ACCCGGACGT TCTGGGCTAT 
GGCACCGTGC TCGATCTCAA TGCGCTCTCG GTGCAGGACC GCGCGGCCTT CCGCACGCTC 
GATCTCGGGA TCGCCACCCT GACCCCCGAG GAACTCGGCC CTGTGCAGCC TGAACCGCAC 
CCCAGCTGGA TGACCCGCAT CTCCGAGGAC TGGGTGGCGC GCTACGGCGT TGGCAACTGA

Protein sequence

MKRILSLALA LAPLSAWATP DPADWPAVVE DAKGQTVHWH AWGGSTATND FIAWVGERLE 
DDYDITLNHV KLESTADAVT RVLTEKSAGQ DDDGAVDLIW INGANFAAMK DADLLFGPFA 
EALPNWQLAD TENKTLQHDF TVPTEGYESP WAMAQVVFMH DTADLPERLG SMEALLDWAR 
EHPGRFTYPQ PPDFLGTTFL KQALVDLSDN ADALSKPVNE DNYQEVTAPL WAFLEELTPL 
LWREGRAYPA TGPRQLQLMN DDEIDLAISF SPGEASTAIA NYQLPESVRT FVLDKGTIGN 
ASFVAIPYNS GSKAASMVVA NFLMSPEAQL RAQDPDVLGY GTVLDLNALS VQDRAAFRTL 
DLGIATLTPE ELGPVQPEPH PSWMTRISED WVARYGVGN