Gene TM1040_3421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3421
Symbol
ID	4075595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	444126
End bp	445271
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	59%
IMG OID	638004930
Product	secretion protein HlyD
Protein accession	YP_611655
Protein GI	99078397
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0845] Membrane-fusion protein
TIGRFAM ID	[TIGR01730] RND family efflux transporter, MFP subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.159892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.759602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCTT CTATTGATCG CAGAACGGAT CAATTTTGCG CGTGGATCCG CCTTAACTGT 
CTGCTTATAT GCGCGTTGAC TGCGCTTCCT TTGTCTGCCG CAGCACAAGA CCAAAATGCC 
GCGCCGCCAC CGCCTGCCGT CACCGTTGCA ATCATTGAGG AGCGAAACTT TCAAGAAGCC 
GAAACTTTTT CGGGTCGCAT CGAGGCCATT CAATCCGTCG ATCTGATCGC GCGCGTGCAA 
GGTTATCTTA GTGCGCGGCA CTTTGAAGAA GGGGCATTTG TCGAGAAAGG GCAGCCTCTC 
TATACGCTCG ATCAGGACAT CTATCGCAAC ACGGTGCATC AGGCAGAGGC GGCACTAGCC 
GTGGCACAAG CCACCGAAAC CCTGGCGCAG CAGAAGTTTG ATCGCCAAGA GGAACTGACC 
CGGCGGGACG TGCAATCTCG GGCGCTCCTT GAGGAAGCTC AGGCCAATCT TGCCGTCAGC 
CAGGCGAATG TTGCCGCCGC CCAGTCTCAG GTAGAAGCAG CGAGGATCAA CCTCGCCTAT 
ACGGAGATCA GCGCGCCTAT TTCGGGGCTC ATCGGGCGAT CTGCAGTTGC CACAGGAGAT 
CTGATCAGCC CACAATCCGG CCCGATGGCG ACCCTCGTGC AGTTTGATCC GATCTACGCG 
AGCTTTCCGG TGCCTCAGCG CAGCATGATC GATTTTCGCA AACGGGGCGC GCGTAACGAG 
GACGTGTTTG TCTCGCTCAC CTTGGCAGAT GGCTCTGTTT ATCCGCATCA CGGCGTGATC 
ACCTTCACCG ATGTGAGCGC GGCCTCTTCC AGCGATGCGG TCATCGTCCG CGCGACGGTT 
CCAAATCCGG ACAACCTCCT GATCAACAAC GGCCTTGTGG ATGTGCATCT GGTGGCCAAC 
GCCGACAGCC GCGCGCTTGC CCTGCCAGCG CAGGCACTCT TGCTGGATCA GCAGGGAGCA 
TATGTGCTGG TGGTTGACGG TGACGACAGA GTGCAGGCCC AACGGGTCGA AGTGGGCACC 
CAGCGGGCCG GGTACCTGGA GGTCAAAGAC GGGCTGGAGG CAGGTGCGCG GGTCATTGTT 
GAGGGCATCC AGAAGGCACG TCCGGGCAAC AGGGTTACCG TCTCGCTTGT GAACACAGAC 
AACTAG

Protein sequence

MASSIDRRTD QFCAWIRLNC LLICALTALP LSAAAQDQNA APPPPAVTVA IIEERNFQEA 
ETFSGRIEAI QSVDLIARVQ GYLSARHFEE GAFVEKGQPL YTLDQDIYRN TVHQAEAALA 
VAQATETLAQ QKFDRQEELT RRDVQSRALL EEAQANLAVS QANVAAAQSQ VEAARINLAY 
TEISAPISGL IGRSAVATGD LISPQSGPMA TLVQFDPIYA SFPVPQRSMI DFRKRGARNE 
DVFVSLTLAD GSVYPHHGVI TFTDVSAASS SDAVIVRATV PNPDNLLINN GLVDVHLVAN 
ADSRALALPA QALLLDQQGA YVLVVDGDDR VQAQRVEVGT QRAGYLEVKD GLEAGARVIV 
EGIQKARPGN RVTVSLVNTD N