Gene Clim_2439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2439
Symbol
ID	6355910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2673177
End bp	2674508
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	642670029
Product	protein of unknown function DUF21
Protein accession	YP_001944439
Protein GI	189347910
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAATAT TTTTTCTTCT TTTTCTCATC ATTCTCAACG GCCTGTTCGC CATGTCGGAG 
ATCGCACTGA TAACGGCAAA GCGATCCAGG CTGCAGAGGC TTGCCGCTGA GGGCGATAAA 
GCAGCTGATG TTGCACTCAA GCTCGGTCAG GAGCCGACAC GATTTCTTTC GACCATACAG 
ATCGGCATTA CTTCGATCGG TATTCTTAAC GGTATCGTCG GTGAGAATGC CCTTGCCGAA 
CCGTTTTCAC TCTGGCTGCG CTCTCTTGGA ATGGAGAGTG AGATCAGCAG AATTCTCTCG 
ACAGCCCTGA TTGTCGTTTC CATAACCTAT GTGACTATCG TCATTGGTGA GCTGGTACCT 
AAAAGACTCG GCCAGTTCAA TCCCGAAGGT ATTGCAAGGC TTGTTTCCCG ACCCATGCTC 
GCCCTTGGAA TGCTTACCCG TCCTTTTGTC CGTCTGCTTT CGTTTTCCAC CGATACGATA 
CTTCGTCTGA TGGGAAAAAA TCCGCATGCT TCGACGAGTG TAACCGAAGA GGAGATTCAC 
GCCATGCTCG AGGAGGGTTC GGAGGCAGGG ATTATCGAAC AGCAGGAGCA TGAAATGGTG 
CGCAACGTTT TCAGGCTGGA CGACCGGCAG CTTGGAACCC TTATGGTGCC GAGGGCTGAT 
ATCGTTTTTC TTGATGTGGC CCTTCCGCTG GAAGAGAATA TCGATCGGGT GACCGGTTCT 
GAACATTCCC GTTTTCCTGT CTGTCAGGGG GGGCTGCAGT CTCTGCTCGG CGTGGTCAAT 
GCCAAACAGC TCCTGGCGCA GACGCTTAAA GGGGGGCTTA CGGATTTCGC TGCACAGCTT 
CAGCCCTGCG TCTATGTGCC TGAAACCCTG ACGGGAATGG AGCTGCTCGA GCATTTCAGG 
CTCTCGGGAA CCCAGATGGT GTTTGTCGTT GACGAGTACG GAGAAATTCA GGGGCTGGTG 
ACCATGCAGG ATCTTCTGGA AGCGGTGACC GGCGAGTTTG TTCCCCGTAA TCTCGAAGAT 
TCATGGGCAG TGCAGCGAGA AGATGGCTCC TGGCTGCTTG ACGGAATGAT TCCCGTTCCC 
GAACTGAAGG ATTCGCTTGA TCTGAAAAGC GTTCCTGAAG AGGATAAAGG GCTTTACCAT 
ACGCTGAGCG GACTTCTTAT GTGGCTTCTC GGCAGAATGC CCGTTACCGG GGATGTAACG 
GAATGGGAGG GATGGAGACT GGAGGTCATC GATCTCGATG GCAAGCGGAT CGACAAGGTT 
CTGGCATCTC CACTCAATGG AGAGTCTGCG TCAGCGGATT CCGGAAATGC AGCCCGCAGT 
TCGGAAGGGT AA

Protein sequence

MEIFFLLFLI ILNGLFAMSE IALITAKRSR LQRLAAEGDK AADVALKLGQ EPTRFLSTIQ 
IGITSIGILN GIVGENALAE PFSLWLRSLG MESEISRILS TALIVVSITY VTIVIGELVP 
KRLGQFNPEG IARLVSRPML ALGMLTRPFV RLLSFSTDTI LRLMGKNPHA STSVTEEEIH 
AMLEEGSEAG IIEQQEHEMV RNVFRLDDRQ LGTLMVPRAD IVFLDVALPL EENIDRVTGS 
EHSRFPVCQG GLQSLLGVVN AKQLLAQTLK GGLTDFAAQL QPCVYVPETL TGMELLEHFR 
LSGTQMVFVV DEYGEIQGLV TMQDLLEAVT GEFVPRNLED SWAVQREDGS WLLDGMIPVP 
ELKDSLDLKS VPEEDKGLYH TLSGLLMWLL GRMPVTGDVT EWEGWRLEVI DLDGKRIDKV 
LASPLNGESA SADSGNAARS SEG