Gene TM1040_3139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3139
Symbol
ID	4075011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	117760
End bp	118725
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	61%
IMG OID	638004642
Product	oligopeptide/dipeptide ABC transporter, ATP-binding protein-like
Protein accession	YP_611375
Protein GI	99078117
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.241158
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCTTG TTTCTGTCAA GAACCTGAGC CGTGTGTTTG ATGTCTCAAA GCCCTGGCTC 
AACCGGGTGA TCGAGCGTGA ACCCAAGGCC TTTTTGACTG CGGTCTCGGA TGTAGATTTC 
GAGGTCGAAC CTCAGACCAC CTATGCCTTG GTGGGGGAAT CCGGGTCCGG GAAATCCACC 
ATCGGCCGCA TGTTGGTGGG CTTGCTCAAT CCGTCTGACG GCAATGTGGA GATCGAGGGC 
GTTGATCTCG CCAATGAGAA AGACGCCGCC AAGGTCGATG CGATCCGCTC TGACATCCAG 
ATGATCTTTC AGGACCCCTA TGCCTCGCTC AATCCGCGTT GGCGGGTGCG TGATATCATC 
GTTGAACCGG TGGCGGCGCG TGGGGGCAAG ACCGAAGGCC TTGCCGAGAA GCTCCTGGAG 
CAGGTGGGGC TTTCGGTCAA AGACGCAGGC AAATTCCCGC ATGAGTTTTC TGGCGGACAG 
CGACAGCGGA TCTGTATCGC CCGTGCGCTC GCGTCCGAGC CGCGCCTCAT TGTCTGTGAC 
GAGCCCACCT CGGCGCTGGA TGTGTCGGTG CAGTCTCAGG TCTTGAACCT GATGAGCGAC 
CTCAAGGACA ACTTTGGCCT CACGTATGTG CTGATCACGC ACGACCTGAC GGTGGTGCAG 
CATATGGCGG ACCGGATCGG GGTTCTCTAT CTTGGCCGAT TGGTCGAAGA GGGCGCCCCC 
GATGAGCTCT TTGAGCGCCC CAAGCACCCC TACACGCAGA TGCTGCTTGA AGCTGCGCCG 
CGGATGGACG GGTTCGGACG CGAAGTGACA CCGCCCGAAG GCGAGATCCC TGATCCGATC 
AACCCGCCTT CGGGGTGCGC CTTCCATCCG CGCTGTCCGC TGGCGACGGA TATCTGCAAA 
CAGCAGCGCC CCGAGATGCG CAGGCTTGGC ACCACCCGTG TCGCTTGCCA CATGGCGGAA 
GGCTAA

Protein sequence

MALVSVKNLS RVFDVSKPWL NRVIEREPKA FLTAVSDVDF EVEPQTTYAL VGESGSGKST 
IGRMLVGLLN PSDGNVEIEG VDLANEKDAA KVDAIRSDIQ MIFQDPYASL NPRWRVRDII 
VEPVAARGGK TEGLAEKLLE QVGLSVKDAG KFPHEFSGGQ RQRICIARAL ASEPRLIVCD 
EPTSALDVSV QSQVLNLMSD LKDNFGLTYV LITHDLTVVQ HMADRIGVLY LGRLVEEGAP 
DELFERPKHP YTQMLLEAAP RMDGFGREVT PPEGEIPDPI NPPSGCAFHP RCPLATDICK 
QQRPEMRRLG TTRVACHMAE G