Gene Clim_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0109
Symbol
ID	6356074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	119993
End bp	121300
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	59%
IMG OID	642667737
Product	HipA domain protein
Protein accession	YP_001942193
Protein GI	189345664
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTACAA CAGCAAGGGT AAACCTGTGG GGGCGCACGA TCGGAGCGGT ATCGCTCGAT 
AGCGACGCTG CGACTGCAAC CTTCGAGTAC GATCCGGCCT TCGCTCGGAG CGGCATCGAA 
ATCGCCCCGC TGACCATGCC GCTCTCCGGT CAGCTCTACT CCTTTCCCTC GCTGCGTCCC 
GAAACCTTCC ACGGGCTTCC GGGACTGTTG GCGGATTCGC TGCCGGACCG GTTCGGCAAT 
ACGCTGATCG ATACCTGGCT GGCCCGTTCC GGTCGCACGT CCGGCTCCTT CAATGCCATC 
GAGAGGCTCT GTTATACAGG GTCTCGGGGC ATGGGCGTTC TTGAATATGC TCCAGCCATA 
CAATTGGGGG GCTCCGGCTC TGCACCGCTC GAAATCGAAC GGTTGGTCGA ATTGGCTTCG 
GAGGTGTTGA CCCATCGCAA CGATCTGCAG GTCTGGTTCC TCGATGGGGG CAAGGAGCTT 
GCGCTCGGGG AGATTCTCCG GGTCGGCACC TCCGCGGGCG GAGCAAGAGC CAAGGCGGTA 
ATTGCCTGGA ACCCGGAAAC CGACGAAGTC CGTTCAGGCC AGGTGAAGGC CGGAAAAGGG 
TTCGAGTACT GGCTGCTCAA GTTCGACGGA GTGAGCGGCA ACAAGGACAG GGAACAGGAA 
GATCCAAAAG GGTACGGTGC AATCGAGCAC GCATACTACC GCATGGCGCT GGATGCGGGA 
ATCACCATGA CGCCCTGCCG CCTGTTCGAG GAAAACGGTC GTCGCCATTT TATGACGAAG 
CGCTTCGACC GGTTGGAGGA TGGAGGCAAA CTGCACATGC AGTCGCTCTG CGGCATGGCG 
CATTACGACT TCAATCGGGC GGGAGCTTAC GGGTATGAAC AGGCGTTGCA GGTCATCAGG 
CGCCTTGGTT TGCCGATGGC TTCCGTGGAG GAGCAGTTCC GGCGAATGGT GTTCAATATC 
GTGGCCCGCA ACCAGGATGA CCATGTGAAG AACATTGCCT TTCTGATGGA CAGGTCGGGC 
AACTGGTCGC TTGCGCCAGC GTTCGACATG ACCTGGAGCT ATCAACCGGG GGGAGCGTGG 
ACATCGACCC ATCAGATGAC GATGAACGGC AAACGGAGCG GATTCCTGCC GGACGACTTC 
AGGGCATGTG CGAAAAGCGC ATCCATGAAA CGCGGGCGAG CCGAAACCAT CGTCGCTGAA 
GTGCAGGACG TTGTTCGCAG ATGGCATGAT TATGCCGAGG AGTCGCGCAT CACTCCCCGA 
CAACGGGATA CGATTGCAAC AACGCTGAGA CTGGAGGGCT TTGTATGA

Protein sequence

MSTTARVNLW GRTIGAVSLD SDAATATFEY DPAFARSGIE IAPLTMPLSG QLYSFPSLRP 
ETFHGLPGLL ADSLPDRFGN TLIDTWLARS GRTSGSFNAI ERLCYTGSRG MGVLEYAPAI 
QLGGSGSAPL EIERLVELAS EVLTHRNDLQ VWFLDGGKEL ALGEILRVGT SAGGARAKAV 
IAWNPETDEV RSGQVKAGKG FEYWLLKFDG VSGNKDREQE DPKGYGAIEH AYYRMALDAG 
ITMTPCRLFE ENGRRHFMTK RFDRLEDGGK LHMQSLCGMA HYDFNRAGAY GYEQALQVIR 
RLGLPMASVE EQFRRMVFNI VARNQDDHVK NIAFLMDRSG NWSLAPAFDM TWSYQPGGAW 
TSTHQMTMNG KRSGFLPDDF RACAKSASMK RGRAETIVAE VQDVVRRWHD YAEESRITPR 
QRDTIATTLR LEGFV