Gene Cag_0808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0808
Symbol
ID	3747462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1131852
End bp	1132943
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	35%
IMG OID	637773338
Product	specificity determinant HsdS-like
Protein accession	YP_379117
Protein GI	78188779
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.361917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAAA TTGAACTAAC CACTTTAGGA AAATCGTGTG AGTTTTTCAA TGGCAAAGCC 
CATGAAAAGA GCATTGACGA AAATGGACAA TACATTGTAG TCAATTCTAA GTTTATTTCA 
TCCGAAGGCA AATCTTTTAA ACGCACCAAC GAGCAAATGT TTCCTTTATA CAAAGGCGAC 
ATTGTAATGG TAATGAGTGA TGTGCCCAAC GGGAAAGCCT TAGCCAAGTG TTTTATCATT 
GACAAAGACG ATACCTATTC TTTAAACCAA CGTATTTGTT GCATACGAAG CAATAAGTTT 
GATACCAAAT ATTTGTATTA CCAACTCAAC CGACACGAGC ACTTTTTAGC ATTCAACAAC 
AGTGAAAACC AAACCAACCT ACGCAAAGAC GATATTCTTG CTTGTCCATT GATTAAGCCG 
TCAATGGAAG AACAACAACG CATAGTTTCC ATATTAGACG AAGCCTTTGC AGCCATAGAC 
CAAGCAAAAG CCAACGCTGA ACAAAACCTC AAAAATGCCA AAGAATTATT TGATGGCTAT 
TTACAGAGTG TGTTTGAAAA CCAAGGCGAT GATTGGGAAG AGAAGAAGTT GGGAGAAGTA 
ATAAAATTAG AATATGGCAA ACCCTTAGAT GAGACAAAAA GAAAGTCAAA TGGTAAATAT 
CCTATGTATG GAGCAAATGG GATAAAGGGC AGAACTGATG AATACTATCA CGATAAAAAA 
TCAATTATTG TTGGTAGAAA AGGTTCCGCA GGCGAAATCA ATTTAACTGA AAATAAATTT 
TGGCCACTTG ATGTAACTTA CTTTGTTACT TTTGATGAAA AAATATATGA TTTGATGTTT 
TTGTATTTTC TTCTATCAAG ATTTGATTTA CCAAAACTAG CAAAAGGTGT TAAGCCAGGA 
ATAAACAGAA ATGAAGTTTA TGAAATTCAA GCTTTATTCC CATCACTCGA AGAACAACAA 
ACTATCGTCC GCCAATTAGA TACCTTACGA GCTAAAACAC AAAAGCTCGA AGAAATCTAT 
CAACGGAAAA TTGCTGATTT AGAAGAATTA AAGAAAAGCA TGTTGCAGAA AGCATTTGCT 
GGGGAATTAT AA

Protein sequence

MSQIELTTLG KSCEFFNGKA HEKSIDENGQ YIVVNSKFIS SEGKSFKRTN EQMFPLYKGD 
IVMVMSDVPN GKALAKCFII DKDDTYSLNQ RICCIRSNKF DTKYLYYQLN RHEHFLAFNN 
SENQTNLRKD DILACPLIKP SMEEQQRIVS ILDEAFAAID QAKANAEQNL KNAKELFDGY 
LQSVFENQGD DWEEKKLGEV IKLEYGKPLD ETKRKSNGKY PMYGANGIKG RTDEYYHDKK 
SIIVGRKGSA GEINLTENKF WPLDVTYFVT FDEKIYDLMF LYFLLSRFDL PKLAKGVKPG 
INRNEVYEIQ ALFPSLEEQQ TIVRQLDTLR AKTQKLEEIY QRKIADLEEL KKSMLQKAFA 
GEL