Gene Clim_0548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0548
Symbol
ID	6354899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	619278
End bp	620309
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	52%
IMG OID	642668184
Product	hypothetical protein
Protein accession	YP_001942619
Protein GI	189346090
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR00661] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCC TTTTCGGGGT CCAGGGTACG GGAAACGGAC ATATCAGCCG CAGCCGGGAG 
CTGGTAAGAA AGCTCAAGGA GAACGGCCAT GATGTTGCGG TGATTATCAG CGGAAGAAAA 
GAAGAGGAAC TGAAGGAGAT CGGTATCTTC GAGCCGTATC GGGTTATGAA AGGACTTACG 
CTGGTGACCT ACAAGGGCAG GATGAATTAC ATGGAAACCA TGTTTCAGCT CGATCTTGCA 
CGTCTTATGA GTGATGTTCT GATGCTCGAT ACGTCGGGTA TAGACCTCAT TATTACCGAT 
TTTGAACCGA TCACCTCGAT GGCGGCCCGG ATAAAGAATA TTCCCTGTAT GGGGTTCGGC 
CACCAGTATG CGTTTCGTTA CAACATACCG TTTGCGCGCG GCAGCATTTT CGAAAAGTAC 
ACGCTTCTGA ACTTCGCTCC GGCCAGATAT AACGCGGGAT TGCACTGGAG CCATTTCAAC 
CAGCCGATCT TTCCTCCGGT TATTCCTGAA ATGCTGTATG TTTCACAAAA ACGTGAGGTT 
GACAGCCGCA AGCTTCTCGT CTATCTTCCG TTTGAAGAGG TAGAGGATGT CGCTGCCTTT 
GTAAGGCCTT TCGGAAATTA TCAGTTCTGC ATTTATGGCA AGGTGAAAGA AAATCTTGAC 
GAAGGTCACC TGCATTTCAG GAGTTATTCG CGCGAGGGCT TTCTGAATGA TCTGACGGAG 
TGTAACGGCG TGGTCTGCAA TGCAGGGTTC GAACTGCCGG GCGAAGCGCT GCATCTTGGC 
AAGAAACTGC TTCTCCGCCC TCTTGACGGA CAGATCGAGC AGGAATCCAA CGCGCTTGCC 
ATGGAGGAGC TGCAGTATGG CATGGCCATG CATTCGCTCG ACCCCGACCT TCTCGCCAGC 
TGGCTTGAAC TGCCAGGGCG CGAGCCGCTG AACTACTCCC GTACGGTTGA TTTCATTGCC 
GAATGGATCG GAAGCGGAGA CTGGGAGGGG CTTTCCCGAT ACACGGAAGC CGCTTGGAAG 
GCAACATTCT GA

Protein sequence

MKILFGVQGT GNGHISRSRE LVRKLKENGH DVAVIISGRK EEELKEIGIF EPYRVMKGLT 
LVTYKGRMNY METMFQLDLA RLMSDVLMLD TSGIDLIITD FEPITSMAAR IKNIPCMGFG 
HQYAFRYNIP FARGSIFEKY TLLNFAPARY NAGLHWSHFN QPIFPPVIPE MLYVSQKREV 
DSRKLLVYLP FEEVEDVAAF VRPFGNYQFC IYGKVKENLD EGHLHFRSYS REGFLNDLTE 
CNGVVCNAGF ELPGEALHLG KKLLLRPLDG QIEQESNALA MEELQYGMAM HSLDPDLLAS 
WLELPGREPL NYSRTVDFIA EWIGSGDWEG LSRYTEAAWK ATF