Gene TM1040_0568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0568
Symbol
ID	4077919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	604197
End bp	605432
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	55%
IMG OID	638005865
Product	hemolysin-type calcium-binding region
Protein accession	YP_612563
Protein GI	99080409
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2931] RTX toxins and related Ca2+-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.294597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000308959
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGATTT TAACTTCAAG CGACTCAATT GACGCGATCT TATTTCCAAG CACCTTCATT 
TCCGGTGGAT ACATTTTCCC AACGCCTGTC TACAGATATG ATGTGACTGA CAGCTACATT 
TCCTACACGC TTGACCAAAC GCGCGGCTCG ACCGGCTATT ACAACATAAA CCCAACTGTT 
CGGATATTTG GGGACAATCT CAGTGTCGAC TCGTCTGGGC GTGCGTCAGG CACGATCACC 
GCGATGGAGT TTCGCTCTTC TAATCGGGGC GAGATCGCAC GCATTGAGCA GATCAGCATC 
AATGCATCCG ATTTCACGGA CATCATTTTC GCACGGATCT CCGGAGACAA TACGTCAAGC 
ACACAATTCG AGACCCTGCT GGCAGAGGCT TTGGACGTTC TTGAATTTGG CAATCGCAAC 
CAAGACATCT CTGACAGAGG CATGTTGCAG TATTTGAGCT TCATCGACCT GCAGGGAGGA 
AACGACGAAT TCCATCTCGC GCGCCCCAAA ACTGACGGGA CACGCACAAT TGACGGCGGC 
GCGGGTCAGG ACACGCTCCA TCTTGATGAC TTCGGCGTGC CCGACTCGTT TGTCGTGAAC 
TTAAAGACAG GCCAGATCAT CACCGACTCA ACTTCGGTGA ATATCACTGG CTTTGAGATC 
ATTGACGGCA ACCCCTTCGT CGATCGCTAT ATTGGTTCCA ACAGCGGTGA TCACATCAGA 
GCAGCTGGTC GCGCCGATCA GATCAACGGG TTCGGGGGGC GCGACACCCT CTCTGGAGGA 
TGGGGGGATG ACAGGATCAC GGGTGGCCGA GGCAAAGACA GACTTCATGG CGACGAAGGC 
AACGACTTTC TGCGCGGGGA CGCGGGCGCA GATCTTCTTG TTGGTGGCGC AGGGCGGGAT 
CGCCTCGTCG GCCGCGCCGG GCAGGACACG CTCATCGCAG ATGACGGGCG GGACCGCCTC 
ATCGGCGGAG CGGGTTCGGA CCTCTTCGTG TTCAATCTCA GCGGCTCTGG AAGCAAGATC 
CGCGACTTTG ACATCTCTGA GGGAGATCAC ATCCGACTCG ACACAGACGG GAGTTACGCC 
TTTGACACCG ATAGTCTGAA ACTGACGCGC TCTGGCTTTC GGATAAACAC AATCGACTCA 
GACTCGAATG TCGAGACGCT TCGGGTCGTG CTGAATGATG ACGCGAGACA TGACCTCAGC 
CTCGACGCGC TGTGGGACGT CCTGACATTT GGCTGA

Protein sequence

MAILTSSDSI DAILFPSTFI SGGYIFPTPV YRYDVTDSYI SYTLDQTRGS TGYYNINPTV 
RIFGDNLSVD SSGRASGTIT AMEFRSSNRG EIARIEQISI NASDFTDIIF ARISGDNTSS 
TQFETLLAEA LDVLEFGNRN QDISDRGMLQ YLSFIDLQGG NDEFHLARPK TDGTRTIDGG 
AGQDTLHLDD FGVPDSFVVN LKTGQIITDS TSVNITGFEI IDGNPFVDRY IGSNSGDHIR 
AAGRADQING FGGRDTLSGG WGDDRITGGR GKDRLHGDEG NDFLRGDAGA DLLVGGAGRD 
RLVGRAGQDT LIADDGRDRL IGGAGSDLFV FNLSGSGSKI RDFDISEGDH IRLDTDGSYA 
FDTDSLKLTR SGFRINTIDS DSNVETLRVV LNDDARHDLS LDALWDVLTF G