Gene TM1040_0542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0542
Symbol
ID	4077189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	574699
End bp	575739
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	64%
IMG OID	638005839
Product	ABC transporter related
Protein accession	YP_612537
Protein GI	99080383
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.999499
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAGC TGACCCTGTC CGACATCACC AAACACTTTG GCGACGCGCC TGCTTTGCGC 
TCCATCTCGA CCACTGTGCG CGATGGAGAG TTCCTCGCCC TTCTGGGTCC TTCGGGCTGC 
GGGAAGTCCA CGCTTTTGCG ACTGCTGGCC GGATTCGAGA CCCCCAGCGA GGGGCGCATT 
TCCATTGGAA CGCGCGAGGT CGCCAATGCA GAAAGACGCC TGAACCTGCC GCCCGAAGAA 
CGCAACATCG GCTTTGTGTT CCAGTCCTAT GCGCTCTGGC CGCATATGAA CGTGCGGCGC 
AATGTGGGCT ATCCGCTGGA AATCCGCCGC CTGCCCCGGG CAGAGCAAGA CGCCCGGATT 
GATGCGGCGC TGCAGGCGAC CGCCCTTGAA CCCTATGGCG CGCGGATGCC CGCGGAGCTT 
TCGGGTGGGC AACGGCAGCG GGTGGCGCTT GCGCGCTGTC TGGTCTCTGA TCCTACGGCG 
GTTTTGCTGG ATGAGCCGCT CGCAAATCTG GACGTGGCCT TGCGCGCGTC GATGCAACAG 
GTCTTTAGCG ACTTTCACCA GCGCACTCAG GCCACCATGG TCTATGTCAC TCACGACCAG 
GCCGAGGCGA TGGCCATGGC GGATCGCATC GCGGTCATGA ACCAGGGTGA GATCGTACAA 
CTCGACACGC CCGAGGCCCT TTATGCCCGC CCCCGCAGCC GCTTTGTCGC CGAATTCGTG 
GGCGAAGGCG CTGTGGTGCC CCTGATCGGC GCGACCCATC ACGACAGAGG CGCAGAGGCG 
ACCTTGCTCG GGGCGCGCTA CCCCATTGAA ACCGACACTC AAACCCCGGC GCTTGCCTGC 
CTCAGACCTG AAAACCTGCA GATTTCGGAC GCCGGCAACA TTCGCGCGCG GGTGGAGCGG 
GTGACGTATC TCGGGGGACG CTACCGGCTC GAACTGACCG CCGCGAGTGG CGACAGCCTG 
GTAACCCAAT CCGCAACCCG CTTTGCCCTA GGCGAACAGA TCGGCCTGAC CCTATCCGCC 
CCATGGGCCT TTGCCGCCTA G

Protein sequence

MAELTLSDIT KHFGDAPALR SISTTVRDGE FLALLGPSGC GKSTLLRLLA GFETPSEGRI 
SIGTREVANA ERRLNLPPEE RNIGFVFQSY ALWPHMNVRR NVGYPLEIRR LPRAEQDARI 
DAALQATALE PYGARMPAEL SGGQRQRVAL ARCLVSDPTA VLLDEPLANL DVALRASMQQ 
VFSDFHQRTQ ATMVYVTHDQ AEAMAMADRI AVMNQGEIVQ LDTPEALYAR PRSRFVAEFV 
GEGAVVPLIG ATHHDRGAEA TLLGARYPIE TDTQTPALAC LRPENLQISD AGNIRARVER 
VTYLGGRYRL ELTAASGDSL VTQSATRFAL GEQIGLTLSA PWAFAA