Gene Clim_2467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2467
Symbol
ID	6354737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2705381
End bp	2706697
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	50%
IMG OID	642670056
Product	restriction modification system DNA specificity domain
Protein accession	YP_001944466
Protein GI	189347937
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTTG AAAACCTTCA ATGCGCAGAT GCGTCACTTG AAACAATTCA TTGTCAACAA 
AGTGATGGAG ATTCTGGAGA TTGGATGAAA GTTGGTTTAA CCGAGTCAAC GCTTGCTGAG 
GTATGTAGTC TCGTTACCGA CGGTACGCAT GATACTCCGA AGCGGGTCGA AACCGGCTAT 
CCTCTTGTCA AGGCGAAGGA AATTTCAGGG GGTCGGATTG ATTTTGATAA CTGTGATCAG 
ATTTCTGAGC AAGAGCACCT TAAAGTCATC GCTCGATCCA AGCCAGAATT TGGTGATACA 
CTTTTTGCCC ACATCGGTGC ATCATTGGGT GAGGCGGCGT TCGTGAATAC CACTCGTGAG 
TTCAGTATTA AAAACGTTGC GCTGTTCAAA CCGAATCCAT CCGTGATTGA TGCTCGTTAC 
CTCTATTACC TTGTAGTCAG TCCCGCATTC CAATCACTTG CTAAAGGAAC AAGGACCGGT 
TCGGCGCAAC CGTTTCTCGG ACTCAGTCAG TTGCGCGGAC ACCAAATTCA ATATCATCGT 
GACTTGGCCC ATCAAAGGCG AATTTCGGGT ATTCTTTCAG CGTATGATGA CCTGATTGAG 
AACCGTCAGC GACGCATCCG GATTTTGGAG GAGATGGCCC GCTCTCTCTA CCGTGAGTGG 
TTCGTCCACT TCCGCTTCCC CGGACACGAA AACCATCCGC TTGTTCCCTC TTCTCTTGGC 
GTCATTCCGC AGGGGTGGGA GGTGAAAAAG CTTGGTGATA TAGCGGAAAG CATGCGACGC 
AACGTGTCGA AAGGCAAACT CGAAGAAAGA ACGCCGTACG TCGGTCTTGA ACATATTCCT 
CGGCAATCGC TTGCACTCGA TGCATGGGAA ATGGCAACCG CACTCGGCTC GAACAAACTG 
GAGTTCAAGA AAGGTGAAGT TCTGTTCGGC AAGATTCGGC CATACTTCCA TAAGGTCAGT 
GTTGCGCCCT TCGTCGGACT TTGCTCCGCC GACACCATCG TCATCCGCGC CCTTCGTCCA 
GAGCATTACG GCATTGTCGT CGCATGTGTC TCAAGTGATG AGTTTGTTGC CGTTGCGAGC 
GCGACCGCAA ACGGCGCGAA GATGCCCCGG GCAAATTGGA ATGTGCTTGA GAAATACCAA 
GTAGTTATTC CAAAAGGCAA TCTGGCAGAG AAATTCTCTG CGCTGTTCGC TGATATTATT 
GCTCAGCAAC AAACGCTTAT TTTCAAAATC CAAAATCTTC GCCAGACGCG CGACCTGCTG 
CTGCCGCGTC TACTGTCGGG GGAGGTGAAA CTCAAGGAAA CTGACGAACC ATTATGA

Protein sequence

MNVENLQCAD ASLETIHCQQ SDGDSGDWMK VGLTESTLAE VCSLVTDGTH DTPKRVETGY 
PLVKAKEISG GRIDFDNCDQ ISEQEHLKVI ARSKPEFGDT LFAHIGASLG EAAFVNTTRE 
FSIKNVALFK PNPSVIDARY LYYLVVSPAF QSLAKGTRTG SAQPFLGLSQ LRGHQIQYHR 
DLAHQRRISG ILSAYDDLIE NRQRRIRILE EMARSLYREW FVHFRFPGHE NHPLVPSSLG 
VIPQGWEVKK LGDIAESMRR NVSKGKLEER TPYVGLEHIP RQSLALDAWE MATALGSNKL 
EFKKGEVLFG KIRPYFHKVS VAPFVGLCSA DTIVIRALRP EHYGIVVACV SSDEFVAVAS 
ATANGAKMPR ANWNVLEKYQ VVIPKGNLAE KFSALFADII AQQQTLIFKI QNLRQTRDLL 
LPRLLSGEVK LKETDEPL