Gene Clim_0931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0931
Symbol
ID	6354168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1018684
End bp	1019955
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	45%
IMG OID	642668558
Product	protein of unknown function DUF324
Protein accession	YP_001942989
Protein GI	189346460
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0413017
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAGA CATTCAAATC ATTCGTTGAA CCCTTTCCGC ATACAATATC AGAAATTAGT 
GAGCTGCTAT CAAACTTAAG CCAAGCAGAG CAGGCTATCA AAGTGAATAA GAGAAATAAG 
GAGGTGCGAC AGCAATACGA AAACCAAGCT AAAGATTTGC ACCGACAACT GCTTACGCAT 
AAAGATTGCT CATTGATATA CAACTATATG GAAGCGACAG GCATAGCGGA TAAGGATACT 
TTTCGTAGCA CTTGGGCAAG GGAGAAGCTA AAAGTTGATT CTGATGAGTT ACCAGATTTT 
CTCAAACCGC CCCTGCTTGA TGATTTGTCC TGTTTGCCTG TCGGTTCATT TTATATTCAG 
TTCAAGTTTA CCTTGCTCAA GCCGTATATC TCTCGGGACG ACAATGCGTT TTATCTTGTG 
GACAATTCCA TTGTGCGGGA AAAGGTTTTT CGCTTTCCGA TGGTGCGTTC CACCGCATGG 
AAAGGTTCAT TGCGCCACGC TCTGTGGCAA ATGGATGGAT ATCAGAAGGA AGACCAGCAA 
GATCAGCAAA TCAAGCGCCT ATTCGGTACA GCCAATGATG AACAACCGGA GGAAGGGAAC 
AGTGGCCGTT TTTATTTTTA CCCCTCTTTC TTTACCCTAA ACAGCTTGGA AGTCATCAAC 
CCCCACGGCC GGAAAACGCG TGTAGGCACA ACTCCTATCC TCTTCGAATC TGTACCTATT 
GGTGCCGAGG CCACTTTCAC CCTGCTATAC TCTCCCCTTG ACCGCATCGG TAGAGAAGAT 
GTCGAAACAC GTCAGCAAGT TATTGCCGAC CTGAAACTGG TAGCCGAAGG GCTACGGGCG 
TTGTTTATCG TATATGGTTT TGGAGCCAAG ACCAGTAGTG GGTTCGGCCT GGCTAATGAT 
GCGATTGAAA ATGGTTCTCT AATTCTCAAT TTGCCCAGCT TTGTTTTCCC TCAGGCTGAA 
ACCGTTCAAG TTCAAACGCC GGAAGATGTC TTTCTGAAAT ACATGGATGA ATCTGGTTAT 
CTTAAAACTG TTTTTTCAGG AGGCGGTGAC TACGGGTTGA TGAGCAATAA GGAGTATGGA 
GAAAAAAGAG AGCAGTTGGG TGGTGGGTAC CTTACCGAGT TCAAGGCATT TCGCAAATGG 
TATGGTGAAA ACGGTGAACA ATGGCAAAAG TCAATAAAAG AAAAAAGCTC AGCTACGAAC 
TACCCTCAAC TCAGGTTTAA AAGTCTCAGC CAATTAGCCG AGAGGATGCG TCAGACGGGA 
GGGGAAGCAT GA

Protein sequence

MNQTFKSFVE PFPHTISEIS ELLSNLSQAE QAIKVNKRNK EVRQQYENQA KDLHRQLLTH 
KDCSLIYNYM EATGIADKDT FRSTWAREKL KVDSDELPDF LKPPLLDDLS CLPVGSFYIQ 
FKFTLLKPYI SRDDNAFYLV DNSIVREKVF RFPMVRSTAW KGSLRHALWQ MDGYQKEDQQ 
DQQIKRLFGT ANDEQPEEGN SGRFYFYPSF FTLNSLEVIN PHGRKTRVGT TPILFESVPI 
GAEATFTLLY SPLDRIGRED VETRQQVIAD LKLVAEGLRA LFIVYGFGAK TSSGFGLAND 
AIENGSLILN LPSFVFPQAE TVQVQTPEDV FLKYMDESGY LKTVFSGGGD YGLMSNKEYG 
EKREQLGGGY LTEFKAFRKW YGENGEQWQK SIKEKSSATN YPQLRFKSLS QLAERMRQTG 
GEA