Gene TM1040_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1984
Symbol
ID	4077168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2088076
End bp	2089935
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	63%
IMG OID	638007299
Product	ABC transporter related
Protein accession	YP_613978
Protein GI	99081824
COG category	[V] Defense mechanisms
COG ID	[COG1132] ABC-type multidrug transport system, ATPase and permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.434554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACGC AATACATGTC ATCGCGCAAA TTGTTGCGCT GGCTCTGGCG CGGCTACCTG 
CGGCACCACG TCGGACTATT GGCGATTGCT GTCTTCTTCA TGCTGCTCGA GGGCGCCTCC 
GTGGGCGGGC TCAGCTACAT GATGCAGCCG ATGTTTGACC TCGTGTTTGT GGACGGCAGC 
GAAAACGCCC TCATCTGGGT GAGCGTTGCG TTTTTTGCCA TCTTCGTGCT GCGCGGCTTC 
AGTTCGGTAA CGCAGCGGGT GATCCTCGCC ACGATCAACC AGCGGTCCGA GGCGCATATG 
CGCACGGATA TGCTCGAACG GCTGATCCAT CAGGACGCGA GCTTTCACCA GCATCACCCG 
CCCGGCTTCT TGATCCAGCG CGTGCAGACT GACGTCGCGG CGATCAACCA GGTCTGGCAG 
GCGATCATCA CCGGCTCGGG ACGCGATGTG GCGCAGCTTG TTGCAGTGCT GACCGTCGCT 
ATCAGCGTCG ACTGGCGCTG GACCCTGATC ATGCTGATCG GCGTGCCGCT TCTGGTGTTG 
CCGCTCTCGA TCGTGCAGCG GTATGTCCGC AAGAAAGCCA GCCTTGCTCG CGACCTTGGC 
GCAGTGCAGG CGACCCGTCT CGACGAGGTC TTCCACGGTA TCGTCCCGAT CAAGCTCAAC 
CGGCTTGAGG ACTACCAGAG CGGGCGTTAC CGCTCGGCAA CTGCGGCCTT TGTCCGGGCG 
CAGATCAAGG CGGCCCTCGG CGCCTCCTCG ACCACGGGGA TGGTGGATCT GATGGCTGGT 
TTCGGGGTCA TGTGCGTGAT CCTCTTTGGC GGGCGCGAAA TCATCGACGG CGACAAGACC 
GTCGGCGAAT TCATGAGCTT TTTCACCGCC ATCGGCCTCG CCTTTGACCC GATGCGCCGC 
CTCGCCGCTA TCATGGGCAT CTGGCAGGGC GCCGCCGCCG CGATGGAGCG GATCAAGGAG 
CTGATGGATG AACCCATCAC GCTCGTGTCC CCGGAACACC CCAAGCCCGC CCCCAAAGGG 
CTGCCCGAAA TCCGTCTTGA TAACGTGAAC CTCTATTATG GCGAGGCGCA TATCCTGCGC 
GATCTGTCAC TGGTGGCCGA AGCCGGCAAG ACCACCGCGC TGGTGGGCGC CTCCGGTGCC 
GGGAAATCCA CCATTTTCAA CATCCTGACC CGGCTTGTTG ATCCCCAGAC CGGCTCTGTG 
ACCCTGGATG GCACTGAGGT GCGGGATCTT GATCTGGGCG ATCTCAGGGA TCTCTTTTCC 
GTGGTCACCC AGGACGCGCT GCTGTTTGAC GAGACGCTGC GCGAGAACAT CCTTCTGGGG 
CGCACGGATG TGAGCGAAGA ACGCCTTGCA GAGGTTCTGG ATGCCGCTCA TGTGTCGGAC 
TTTCTGCACA AGTTGCCCGA AGGGCTCGAA ACCCGCGTGG GCCCGCGCGG CTCGGCGCTC 
TCGGGGGGGC AGCGTCAACG CGTGGTGATC GCCCGCGCGC TCTTGCGGGA CACGCCGCTC 
CTGCTGTTGG ACGAGGCCAC CTCGGCGCTG GATGCTCAAT CCGAGAAAGT GGTGCAAAAG 
GCGCTCGAGA AACTCTCTGG TGGGCGCACG ACAATCGTGA TCGCGCACCG TCTTTCGACC 
ATCCGCTCGG CGGACAAGAT CGTGGTGATG GAGCGCGGCC GCGTGATGGA TCAGGGCCGC 
CACGAGGAGC TGCTGGAGCG CGGCGGGATC TATGCAGATC TCTATCGTTT GCAGTTCCAG 
GACGGGAAAA CCGTGATCGA CACCGATGGG ATGAACGCCC AGATCGCGCA GAACGACAAT 
CGCAACGCAC GCGAGGAAAC CGGCCTTCTA CGCCGCTTTG CCCGCCGCCT CTTTGGCTGA

Protein sequence

MSTQYMSSRK LLRWLWRGYL RHHVGLLAIA VFFMLLEGAS VGGLSYMMQP MFDLVFVDGS 
ENALIWVSVA FFAIFVLRGF SSVTQRVILA TINQRSEAHM RTDMLERLIH QDASFHQHHP 
PGFLIQRVQT DVAAINQVWQ AIITGSGRDV AQLVAVLTVA ISVDWRWTLI MLIGVPLLVL 
PLSIVQRYVR KKASLARDLG AVQATRLDEV FHGIVPIKLN RLEDYQSGRY RSATAAFVRA 
QIKAALGASS TTGMVDLMAG FGVMCVILFG GREIIDGDKT VGEFMSFFTA IGLAFDPMRR 
LAAIMGIWQG AAAAMERIKE LMDEPITLVS PEHPKPAPKG LPEIRLDNVN LYYGEAHILR 
DLSLVAEAGK TTALVGASGA GKSTIFNILT RLVDPQTGSV TLDGTEVRDL DLGDLRDLFS 
VVTQDALLFD ETLRENILLG RTDVSEERLA EVLDAAHVSD FLHKLPEGLE TRVGPRGSAL 
SGGQRQRVVI ARALLRDTPL LLLDEATSAL DAQSEKVVQK ALEKLSGGRT TIVIAHRLST 
IRSADKIVVM ERGRVMDQGR HEELLERGGI YADLYRLQFQ DGKTVIDTDG MNAQIAQNDN 
RNAREETGLL RRFARRLFG