Gene Clim_0237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0237
Symbol
ID	6354693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	263317
End bp	264564
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	53%
IMG OID	642667865
Product	HipA domain protein
Protein accession	YP_001942311
Protein GI	189345782
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGAGG TCGAGGTTTA TATCGATTGG CAAGGATCCT GCCGATTGAT CGGCAGGCTT 
TACCGTCAGT CCGGCAGGGG ACGGGAGACT GTTTCATTCC GGTATGATGA CCGATGGATT 
GCTGCGGCCG ATCATTTTCC AATAGATGTT TCACTCAAGG TGGGGCGTGG TATTTTCGTT 
CCTCCGGCCG GCAGGGAGAT GTTCGGTACG TTGGGGGATT CCGCTCCGGA CCAATGGGGG 
AGGCGTCTCA TGCGTCGTGC CGAGCGTCGA AGAGCCGAAA AAGAGCTTCG GGCTCCACGA 
ACGCTGTTTG AAACCGATTT TCTGCTGGGG GTTGCCGATG AGACCCGTTT GGGCGCCTTT 
CGCTTCAGAT ATCCGGGAGA TGCGGGTTTT CTGTCATCGA CAGAGAGCGG GGTTCCCAAG 
CTGGTCGAGC TTGGGAAGTT ATTGGGAGTG ACCGAGCGGA TACTGCGTGA CGAAGAGAGT 
GATGAAGACC TCCTGATGAT TTTCGCTCCC GGTTCATCAC TTGGAGGGGC GCGTCCGAAA 
GCATCGGTTA TTGATCAGTA TGGACAGCTT TCGATAGCCA AGTTTCCAAA GGAAAACGAT 
GAATACAGCA TTGAAACCTG GGAAGAGATT TCGCTGACAC TTGCTGCAAA AGCAGGGATA 
AGGACGCCCG TCCATGAACT GAAGAGGATT GCCGGAAAAG CCATTCTGCT TTCGCGCCGT 
TTTGACCGCA AGGATGGTGG GCGTATTCCG TTCATGTCTG CAATGTCCAT GACCGGATCT 
CTTGATGGCG AGGGAGGGAG TTATCTGGAT ATTGTTGATG CTCTCGGTGA GTTTGGCGCC 
CAGGCTCGGA CGGATCGTGC CGAGTTGTTT CGGCGCATGG TTTTCAATGT GCTGATCTCA 
AATGTTGACG ATCATTTGCG AAACCATGGC TTTTTGATGA CGAGCAGGCA CGGATGGGTG 
TTGTCTCCGG TGTTCGATCT CAACCCGACG CCTCAGGATG TGAAACCGAG GGTTCTCTCG 
ACAGCTATCG ATCTGGAAGA CGGAACGTGC TCGATCGGAC TGGTTCGCGA TGTCGCCCAT 
TTTTTCGGAT TGCAGAAGGC TGAGGCGGAT CGAATGATTT CTGATGTTGC TCATGTTACA 
GAGACCTGGT CTGAGGTAGC AAAAACAGTT GGTGCACGGC CGTCAGAAAT AAAACGGATG 
GAGAGCGCCT TTGAGCATGA CGATCTGTAC CGTGCTTTAC GCTTGTGA

Protein sequence

MPEVEVYIDW QGSCRLIGRL YRQSGRGRET VSFRYDDRWI AAADHFPIDV SLKVGRGIFV 
PPAGREMFGT LGDSAPDQWG RRLMRRAERR RAEKELRAPR TLFETDFLLG VADETRLGAF 
RFRYPGDAGF LSSTESGVPK LVELGKLLGV TERILRDEES DEDLLMIFAP GSSLGGARPK 
ASVIDQYGQL SIAKFPKEND EYSIETWEEI SLTLAAKAGI RTPVHELKRI AGKAILLSRR 
FDRKDGGRIP FMSAMSMTGS LDGEGGSYLD IVDALGEFGA QARTDRAELF RRMVFNVLIS 
NVDDHLRNHG FLMTSRHGWV LSPVFDLNPT PQDVKPRVLS TAIDLEDGTC SIGLVRDVAH 
FFGLQKAEAD RMISDVAHVT ETWSEVAKTV GARPSEIKRM ESAFEHDDLY RALRL