Gene TM1040_1886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1886
Symbol
ID	4077383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1986308
End bp	1987381
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	63%
IMG OID	638007202
Product	integral membrane protein-like
Protein accession	YP_613881
Protein GI	99081727
COG category	[S] Function unknown
COG ID	[COG5480] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTTCC CGGCTGTTAG GCGCCTGTGC CTGCTGGCCG CTACGCTCGC CTTGCCGTCT 
GCGGGGCAGG CGGCGCTTGA CCTGTGCAAC GACACCACCG CGGCGCAGCG GGTGGCAATC 
GGCTTTCAGG AGGCGGGCGA CTGGACCTCA AAAGGCTGGT GGGATCTGCC TGCTGGCAGC 
TGTACAGAGG TGCTCTCTTC CGCGTCGACA AGCCGGTTTT ATTATCTGCG GGTAGAGACC 
GAGGGCTGGG CCTTCACCGA TGACAGGCTT GGGTTTTGCG TTGCTGACAC GGATTTTGAA 
ATCAAGGGCG AAGATGGGTG CGCGCGCCGT GGCTTTCGCC AGGAGAATTT CGCACGGATC 
GACACCAGGG GCGCCGCTGC ACCCGACCCA ACAGCCCAGA CGCGGCCAGC CGCAGATCCG 
GACACTGGGT CCGACGCCGC GCGCAGGACT TTTACACACC ACCTCAGCGC CCATCTCACT 
CCGATCAAAT CCGACGTCCC GGCGCGCCAT GTGGTTCAGT CCGGGTTCAG CACCAAAGCC 
GTGTTTCAAG GCTGTGATGC GGAAACCACC GCCTATGCCA GCTTTTGCAC CTTCATCGGC 
GCCGGGCGGC GCTATCTGGT TTATGACGAC GGGCGCACCT CCGCCGCGCT CTGGCAGGAG 
ATCCAGCAAG CCATCCGCGG GCGACGCTAC ACGCTCGAGG GTTTGCGAGA GGATCTTTTT 
GACACCACGT CAGAACTGGT TCTGCGCGCC ATCCGACCAG AGCCCGAGGA TCGCTCGGAT 
CAGCTCTTGG CCAGCCTGCA GGGTCTCTGG CGCTCCACCA TCGATCCCAA TGACAGCTTT 
CGCGTCAGCG GGGCCGAGCG CATAAACGCC TATGCCGGGG CGGAAACATC GGTCGAATAC 
CTCTCATTGC ACAAACCCTG CGCCGAGGCG GGCGACGTGG GTCCCTTCCT TTTTACCTGG 
GACAACAATT CCGGCACCAG CCTGTGCTAC GCCATTGCCC GCCTCACTGA CACCGAACTG 
GCGCTGATCT ACCTTCCGCG CGGGACCGAA CTGGTCTACC GCCGCGAGGG CTGA

Protein sequence

MSFPAVRRLC LLAATLALPS AGQAALDLCN DTTAAQRVAI GFQEAGDWTS KGWWDLPAGS 
CTEVLSSAST SRFYYLRVET EGWAFTDDRL GFCVADTDFE IKGEDGCARR GFRQENFARI 
DTRGAAAPDP TAQTRPAADP DTGSDAARRT FTHHLSAHLT PIKSDVPARH VVQSGFSTKA 
VFQGCDAETT AYASFCTFIG AGRRYLVYDD GRTSAALWQE IQQAIRGRRY TLEGLREDLF 
DTTSELVLRA IRPEPEDRSD QLLASLQGLW RSTIDPNDSF RVSGAERINA YAGAETSVEY 
LSLHKPCAEA GDVGPFLFTW DNNSGTSLCY AIARLTDTEL ALIYLPRGTE LVYRREG