Gene Tery_3582 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3582
Symbol
ID	4244215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	5509650
End bp	5510867
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	31%
IMG OID	638108547
Product	McrBC 5-methylcytosine restriction system component-like
Protein accession	YP_723136
Protein GI	113477075
COG category	[V] Defense mechanisms
COG ID	[COG4268] McrBC 5-methylcytosine restriction system component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCTT CCCAAATCAT CGAACTCACT GAATATCAAC CTTACCAGTT TTCACCAGAT 
AAAATTGATT ATAGTATTCC TACTAAATTA TGGCAAGAAT ACGATCAAAA AGGTCAAAAA 
ATTAAAGTTG AATTTCCTAC TCCCAAAACC AACAACAAAT GGCAATTTAC TTCTCAAGGG 
TGGGTGGGTT ATATTCCCAT AACTCTGGAT TTTCACATCA TTCTTAAACC TAAGGTACCA 
CTTCATAACC TATTTGGAAT GTTGGAATAT GCCTACAACC TCAGAAGTTT TTGTTTTTTA 
GATGGTTTAG TTAACTGTAA TTCTCTACAG GAATTTTACA ACTGTTTAGT TAATATTCTG 
GCTCAAAAAA TATTAGAGCG AGGTCGAAAA GGTTTTCATC GTGCTTATCT GCCAAAAACA 
GAAAATTTAA CTTATATTCG GGGACGATTA AATATGCGGC AAGTTATGCA CAAACCCTGG 
GGTGTTAGTT TAAAATGTGA TTATCAAGAA CATACTGCTA ATATTCCTGA TAATCAAATT 
TTGGCTTGGA CTTTGTTTAT CATTAGCCGT AGTAGTTTTT GTTCTGAAAA AGTCGCTGTA 
ACTGTAACAA GAGCTTTTCA TATTTTGCAA GGTTTGGTAA CTTTACAACC TTTTAAATCT 
AGTGATTGTC TGAATATAAA ATATCATCGT TTGAATGAAG ATTATCAGGT TTTACACGGT 
TTATGTCGAT TTTTTTTGGA TAATATTGGA GCTAGTCATC AACAGGGTAA TTACTCAATG 
TTACCTTTTT TAATAGATAT GGCTAAACTC TATGAAAAAT TTGTAGCTAA ATGGTTAAAA 
TTGCATCTAT CCTCAAATTT AAGAGTTAAA GAACAAGAAA AAGTAGAAAT TGTTGATGAT 
AAAATTTATT GTAAAATTGA TTTAGTTATT TATGAAATAA AAACTTGCAA GGTTGTTTAT 
ATTCTTGATA CTAAATATAA GTTGGATTGC AGACCATCGA CAGATGATAT TAACCAAGTG 
GTAGCTTATG CAACTTATAA AAAATGTCAC GAAGCTATTT TGATTTATCC TCAAAGACTA 
ACTAATTATA TTAATCAATT AGTTGGTGAA AGTCAAGTAA GATTGCGTAC TTTGACATTT 
GCTATTGACT CTGATTTGGA AAAAGCTGGT CAATCTTTTT TAGAAGAATT AATATCAAAT 
CCGGTAGTAT CGTTGTAA

Protein sequence

MKSSQIIELT EYQPYQFSPD KIDYSIPTKL WQEYDQKGQK IKVEFPTPKT NNKWQFTSQG 
WVGYIPITLD FHIILKPKVP LHNLFGMLEY AYNLRSFCFL DGLVNCNSLQ EFYNCLVNIL 
AQKILERGRK GFHRAYLPKT ENLTYIRGRL NMRQVMHKPW GVSLKCDYQE HTANIPDNQI 
LAWTLFIISR SSFCSEKVAV TVTRAFHILQ GLVTLQPFKS SDCLNIKYHR LNEDYQVLHG 
LCRFFLDNIG ASHQQGNYSM LPFLIDMAKL YEKFVAKWLK LHLSSNLRVK EQEKVEIVDD 
KIYCKIDLVI YEIKTCKVVY ILDTKYKLDC RPSTDDINQV VAYATYKKCH EAILIYPQRL 
TNYINQLVGE SQVRLRTLTF AIDSDLEKAG QSFLEELISN PVVSL