Gene Cag_0169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0169
Symbol
ID	3747734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	189581
End bp	190696
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	49%
IMG OID	637772696
Product	tetraacyldisaccharide-1-P 4'-kinase
Protein accession	YP_378490
Protein GI	78188152
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1663] Tetraacyldisaccharide-1-P 4'-kinase
TIGRFAM ID	[TIGR00682] tetraacyldisaccharide 4'-kinase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATC CCCTGCGCCT TGCTTTTCGT CCTTTTGCCT TGCTCTACGA AGCAATTGTG 
CAAACTCGTA ACCAGCTTTT TAATCGTGCG GTATTAAGGG CATGGGAATC GCCAATGCCC 
GTTGTTTCTG TGGGGAATTT AAGTGCAGGA GGTACAGGAA AAACACCAAT GGTGGATTGG 
GTGGTGAAAT ATTATCTCTC AATAGGTTTT AAACCCGCAA TTATTTCGCG CGGCTATAAG 
CGCCAATCAA AAGGGGTGCA GCTTGTGTCG GATGGCAATA ATGTGCTACT CAGTAGCCGT 
GAAGCGGGCG ATGAAACCGC TATGTTGGCA TGGAATAACC CCGATGCAAT TGTGGTTGTA 
GCAAGTAAGC GCAAGCAAGG GGTCAAGCTT ATTACCAAAC GCTTTGCCCA ACGCCTCCCA 
TCGGTTATTA TTTTAGATGA TGCTTTTCAG CACCGCCAAA TAGCGCGTTC GTTGGATATT 
GTGTTGGTGA ATGCCGAAGA GCCATTTGTG GAAGCTGCCA TGCTCCCCGA AGGGCGCTTG 
CGGGAGCCAA AAAAGAATTT GTTGCGAGCA GATGTCGTGG TATTGAACAA AATTACCGAC 
CTTGAAGCCG CAACACCATC CATTAAAGCG CTTGAGGAGA TGGGGCGACC ACTTGTTAAA 
GCACGCCTGA GCACCGGTGA ATTAATTTGC TTTTCGGGCG ATGCCACCAC GCTTGACGAG 
CCAGCCACCG CTCACCACCT GAACGCGTTT GCTTTTGCTG GAATTGCAAA ACCTGAAAGC 
TTTGTAACAA GTTTGCAGCA CGAAGGGGTA AATGTGGGAG CAACCCGCTT TGTGCGCGAC 
CATGCACCGT ACAGTGCCAA AATGTTACGA GCTATTCGCC GCCAAGCTGA GGAGCAAGGG 
TTGTGCTTAA TTACCACCGA AAAAGATTAC TTCCGCCTGC TTGGGCAACC CGAACTCCTC 
AGCATTATTA CCGCTCTCCC CTGCTACTAC CTTAAAATAG CCCCCGATAT TTTTGACGGC 
AAAGCGCTTT TGCAAGAGAA GCTAAATGCG GTTGTTCATT ATGTACCAAA ACCGGAGCCG 
CCAAAGAAAA TTGAGGAACC ATATCGGCGA TGGTAA

Protein sequence

MSNPLRLAFR PFALLYEAIV QTRNQLFNRA VLRAWESPMP VVSVGNLSAG GTGKTPMVDW 
VVKYYLSIGF KPAIISRGYK RQSKGVQLVS DGNNVLLSSR EAGDETAMLA WNNPDAIVVV 
ASKRKQGVKL ITKRFAQRLP SVIILDDAFQ HRQIARSLDI VLVNAEEPFV EAAMLPEGRL 
REPKKNLLRA DVVVLNKITD LEAATPSIKA LEEMGRPLVK ARLSTGELIC FSGDATTLDE 
PATAHHLNAF AFAGIAKPES FVTSLQHEGV NVGATRFVRD HAPYSAKMLR AIRRQAEEQG 
LCLITTEKDY FRLLGQPELL SIITALPCYY LKIAPDIFDG KALLQEKLNA VVHYVPKPEP 
PKKIEEPYRR W