Gene Clim_1145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1145
Symbol
ID	6353661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1241978
End bp	1243399
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	53%
IMG OID	642668762
Product	Endonuclease/exonuclease/phosphatase
Protein accession	YP_001943193
Protein GI	189346664
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0301783
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGTTT ACTCGTCACT CAGGATCAGG GAAAACGATG CCGGACACAT CAAGGCCTGG 
AAAAAAAGAA CCGCAGAGAA GCTGCTTCTG CTGCGTGCGG CGCTCGATAC CCATATCGCC 
GATGCTTCAG GGGAGGAGTC TGCCGAACGC GCCTGCGAAA GGAACGGACG GCAATGGCTG 
AGACTTGCCA CATGGAATAT CCGCGAGTTC GATACGTTAA AATATGGTGG TCGTCTCAAG 
GAGTCACTCT ATTTTATTGC TGAAATAATT TCGCATTTCG ATATCGTAGC GCTTCAGGAA 
GTTCGTGAGG ACCTTGCCTG CCTGCAGTCG GTCGTACAGT TTCTCGGTCA GCATGAGTGG 
GATTATATCG CAACAGACGT TACCGAGGGC TCTTCGGGAA ACCGGGAACG TATGGTGTTT 
ATCTACCAGA AAAACCGGGT GCGTTTCACC AGCATAGCGG GCGAGGTGAT GCTTGACAAA 
GGCGATCTGG TCACCGATTC TTCCGGCTTG TGCTTTCGCG ACGCTTCGGG GCTGAAAGTG 
GAGTTTCCTG AAGGTGTTAC GCTTTTGCCT TCCGGCGATG TTCCTGTTAT AAAAAGAAAA 
GGCAAGGTGC TGCTGGAGGA CGATCTGGTG ATTCCTCTTC CCGCCGGTAC CAGGATAGTT 
TTGCCTGAAG GAAGTTCGCT TGTTCTGCCC GGCGGCACTC AGCTTCCTGT TGAAAACGGT 
CAGGTCGCCC TGGATGCAGC TTCGCATCAG GCATGGTCGC CTCATGCGCT GGTCCGACCG 
CCGTATGATC TTCTTTCGGG TATCGGCCTG CAGTTCGCAC GTTCACCTTT TCTTGTCACC 
TTCCAGGCTG GCTGGCTGAA ATTCATTCTC TGTACCGTCC ATATCTACTA TGGAACGGGC 
AAGGAAGGGC TGGCCAGGAG AAACGAGGAG ATCAGGAAAC TAACCCGTTT TCTTTCACGG 
AGGGCCGAAA GCGAGCATGA TTCCGATGCA GAAAACTTCT TTTTCGTGCT CGGAGATTTC 
AATATTGTGG GAAAGAAACA TGTGACCTGG GAGTCGCTGC ATTCGAACGG TTTCAGGGTT 
CCCGAACAGC TTCAGAAGAT TCCTGCCGGC AGCAATGCGG CACGCGACAA GGCGTATGAC 
CAGATCGCCT TCTGGCAACC GACGGCAGCG GGGCATCCCG GCACTACCTT CATCGATGTG 
GGTAATGCCG GCATTTTCGA TTACTTCAAG TATGTGTTCC GCTGGGGGGA CGATGATCAC 
GACGGAGAAG ACGAACGGTA CTATGCTGAA AAAACAAAAA CACACAAGCT TGCCTACAAG 
GAGTGGAGAA CCTATCAGAT GTCGGATCAT CTGCCCATGT GGATAGAGTT GAGAACCGAT 
TTCGGTACCG ACTACCTTTC GGCGGTTTCC GCCTCCGACT GA

Protein sequence

MPVYSSLRIR ENDAGHIKAW KKRTAEKLLL LRAALDTHIA DASGEESAER ACERNGRQWL 
RLATWNIREF DTLKYGGRLK ESLYFIAEII SHFDIVALQE VREDLACLQS VVQFLGQHEW 
DYIATDVTEG SSGNRERMVF IYQKNRVRFT SIAGEVMLDK GDLVTDSSGL CFRDASGLKV 
EFPEGVTLLP SGDVPVIKRK GKVLLEDDLV IPLPAGTRIV LPEGSSLVLP GGTQLPVENG 
QVALDAASHQ AWSPHALVRP PYDLLSGIGL QFARSPFLVT FQAGWLKFIL CTVHIYYGTG 
KEGLARRNEE IRKLTRFLSR RAESEHDSDA ENFFFVLGDF NIVGKKHVTW ESLHSNGFRV 
PEQLQKIPAG SNAARDKAYD QIAFWQPTAA GHPGTTFIDV GNAGIFDYFK YVFRWGDDDH 
DGEDERYYAE KTKTHKLAYK EWRTYQMSDH LPMWIELRTD FGTDYLSAVS ASD