Gene Clim_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1474
Symbol
ID	6354787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1579699
End bp	1580979
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	59%
IMG OID	642669081
Product	HipA domain protein
Protein accession	YP_001943509
Protein GI	189346980
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.738708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACCGTT CCGTAAACCT TATTGAAGTT CGCGCCTGGA ATCGCACCGT CGGAACCGTT 
ACGATGGAAC CCGGATCCGG CAGCTGCATC TTCGAATACG ACCCCTCGTG GCAGGACGGA 
GGCATCGAGC TTGCGCCGCT GACCATGCCT CTCAGTCAGG CCGTCCACGC TTTTCCGCTG 
CTGCCTGAAG CCACCTTCAT GCGGCTCCCC GGACTGCTTG CCGACTCCAT ACCCGAAGGG 
TTCGGCAGCA GGCTGATCGA GACCTATCTG GTAAACGAGG GACTCTCACC TGAAGCGATA 
ACGCCGCTGG ACCGGCTCGC ATACATGGGC AACAGCGGCA TGGGCGCGCT GGAGTTCCGC 
CCTATGCGCG GCCCTCGCTT TTCGAAACCG AAAGAACTGG AAATTGATTA TCTGGTTGCC 
GCATCGGACG CGGCGTTTGC AGCAAATATC CACAACGACC GTGAAACCGA GGCCGCATTG 
ACGAACCTCT TTCAGGTCGG CGCATCCGCC GGAGGCAAAC AGCCGAAAGC CGTCATTGCA 
TGGAACGAGG AGAGCGACGA AATCCGCTCG GGTCAACTGC CGGCCGGGCC GGGTTTCGAG 
CTGTGGATAA TCAAGCTTGA TGGCGTAGCC ATGGATTGTG ATACGAGCTG TGAAAGCTCT 
TTCGGACGGA TCGAATACGC CTATTCGATG ATGGCAAAAG CTGCCGGTAT TGCCATGACG 
GAATGCGGCC TGCTCGAAGA GAACGGACGG GCGCACTTCA TGACTCGCCG CTTCGACCGC 
CGGGATGGCG AAAAACTGCA TCTGCAGAGC CTCTGCGCCT TGCGGCATCT CGACTGCATT 
GAAGGGGAAA CCCACGATTA CGACCGGTAC TTCGAAACCG TCAAAGCACT CGGTCTGCCG 
GAACCGGCCA TGCAGGAGGC CTTCAGGCGC ATGGTTTTCA ACGTGCTTGC GGCAAACTGC 
GACGATCACA CCCGAAGCCT CTCGTTCCTC ATGGATGCTG CCGGAACCTG GTCACTCTCC 
CCCGCGTACG GTCTGACGCA CGCCTTCACC CCATACGGAG AGTGGAAGTT CAGGCACAGG 
ATGTCCGTCA ACGGAAAGTT CCGCGATATT GCACGACAGG ATTTCGAAGC GGTTGGAAAG 
CGCTTTTCAG TGCCCGACCA TGAAGGCATC GTCAGGGATG TGGCCGAAGC CGTCCGACGC 
TGGCCGGAAT TCGCCGCCGC CGTGCGGTTG AATCCGGAAA CCCTGCTCCG CGTTCAGCAG 
GATTTCCCGG ATATGGGATA A

Protein sequence

MYRSVNLIEV RAWNRTVGTV TMEPGSGSCI FEYDPSWQDG GIELAPLTMP LSQAVHAFPL 
LPEATFMRLP GLLADSIPEG FGSRLIETYL VNEGLSPEAI TPLDRLAYMG NSGMGALEFR 
PMRGPRFSKP KELEIDYLVA ASDAAFAANI HNDRETEAAL TNLFQVGASA GGKQPKAVIA 
WNEESDEIRS GQLPAGPGFE LWIIKLDGVA MDCDTSCESS FGRIEYAYSM MAKAAGIAMT 
ECGLLEENGR AHFMTRRFDR RDGEKLHLQS LCALRHLDCI EGETHDYDRY FETVKALGLP 
EPAMQEAFRR MVFNVLAANC DDHTRSLSFL MDAAGTWSLS PAYGLTHAFT PYGEWKFRHR 
MSVNGKFRDI ARQDFEAVGK RFSVPDHEGI VRDVAEAVRR WPEFAAAVRL NPETLLRVQQ 
DFPDMG