Gene Clim_0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0439
Symbol
ID	6354434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	490315
End bp	491397
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	40%
IMG OID	642668070
Product	hypothetical protein
Protein accession	YP_001942511
Protein GI	189345982
COG category	[S] Function unknown
COG ID	[COG4861] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGG AACGACTTTA CAATATCACT ACGCTTTTTA AAGAAAAAAT CCTCAATGTT 
CTTGGCTGGC AACTAAAAAA TGAGCCGTTA TTAAAAGAAG CTGAAGGGAT TTTGTTTCTT 
ATGGTTGAAA CTGGAAAAAA GGTATTAAAA GTTGGCGTAG AATACAGAAA AACCCTTTTG 
AGGACAACGT CTTCCTCTTT TTTACCGGAT GAGGTGGATA TTGTGATGGT TGCTGCTCCT 
TATATCGGTT ATGCACAACT GGAACGACTA AAGGCAAATA ACGTCAATGC GATTGACGAG 
GCAGGCAATT ACTACTTTTC GTATCGGAGT GGCAAGGATC GTGTGATCCT GTATGAATTC 
AATCATAGGT CTAAAGCAAC TCGCTTATCT CGCATCGATG CCTTTTCGCC AAAAGCCGGA 
TATGTGGTTA TGGCTCTATT AACCGCAGAA AGATTTGAGA TTTCGACAAT GCGTAAGTTG 
CAAGCTATTA CAGAAGTTAG TCTTAGCGGG ATTTTTTCGA TTTGTGAGGC AATGAAGCGA 
AATGACTTGA TTGATTACTC AAAAAGTTTA CCGATTCGTG TTTTAAATCC AAGTCGTTTT 
TTGGATGAAT GGGCGGCTTA CTTCAAACAG CGTCTTGCAC CGAAATTGAA TAGGCAAGGC 
TATCTGATTT CAGTGAAGAA AATCGTTGAT AAAGAAAGCA GAGAAGTCGA CGTTCAGCAT 
TTGGATTGGC GAGAAGGAGC CAGTGTTTTA CTTGATCAAA TACAAAGCTC CGCATTAACT 
GGCGTTCAGG CTGCGCAATC TGTATCGCGG TTTTATGCTG TGGAAGTCGG AGAAATTTTG 
GTGAGTCACT TGCACGAGGC CGAAAGGGAA TTAACTCGGA AATTTATTCT AACTCCAATG 
ATCAGAAATC CCAACTTAAT ACTGATTGAA CCCTATAACA GCAGCGCATT TATCGGAATA 
AATGAAGAAG GAAAATTTAG AAAAGCGCAT CCGATTCAAA TTTATCTCGA TCTTCTGACC 
TCAGATGACC CGCGTGCGAA TGAATTTGCT GAAATATACC GGGAGAAAGC GCTTGGCTAT 
TGA

Protein sequence

MEKERLYNIT TLFKEKILNV LGWQLKNEPL LKEAEGILFL MVETGKKVLK VGVEYRKTLL 
RTTSSSFLPD EVDIVMVAAP YIGYAQLERL KANNVNAIDE AGNYYFSYRS GKDRVILYEF 
NHRSKATRLS RIDAFSPKAG YVVMALLTAE RFEISTMRKL QAITEVSLSG IFSICEAMKR 
NDLIDYSKSL PIRVLNPSRF LDEWAAYFKQ RLAPKLNRQG YLISVKKIVD KESREVDVQH 
LDWREGASVL LDQIQSSALT GVQAAQSVSR FYAVEVGEIL VSHLHEAERE LTRKFILTPM 
IRNPNLILIE PYNSSAFIGI NEEGKFRKAH PIQIYLDLLT SDDPRANEFA EIYREKALGY