Gene Cag_1275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1275
Symbol
ID	3748313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1737991
End bp	1739268
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	41%
IMG OID	637773813
Product	hypothetical protein
Protein accession	YP_379579
Protein GI	78189241
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.370797
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGATG TTCAAGTTTC ACACAACAGT GTTGGCACCC TTGCACACCA CACATCGGAG 
CAAGGTAGCT ACACCTTTGC CTACCATAAA GCTATTGATA TTGGGCAGGA AGTATCGCTT 
ACTATGCCAT GGTCGCTTGC AAGTTACCAT TACCGCAAAG GGCTTCACCC AATTTTTCAA 
ATGAATTTGC CCGAAGGTAG GTTACGCTAC ACCCTTGAGC GTGCTTTCCG TAAACAGGCA 
CAAGGATTTG ATGATTTAAT GTTACTTGAT ATTATTGGGC ATTCGCAAAT TGGGCGCTTA 
CATTGCACAA GTAACCCTCA GCTCCCTAAA TCGGTGCCAT TGCAAAGTAT TAACGAGCTG 
TTAGCTTACA ATGGCACTGA AGATTTGCTT CGTGATTTAC TTGAACGTTT TTCAGCCACA 
TCAGGCATTT CAGGCATTCA GCCAAAAGTG CTTATTTGTG ATCCCAATCA AGCAGCATTA 
GGTGCAAAAT TTCCAACACA CCATAGTCCA CAGCTCACTA ATGCCCAAGC ACGCATTACC 
GTAAAGGGAG CAACACATAT TGTAAAAGGA TGGGATGAAA ATGAGTATCC TCACCTTGCC 
TTAAATGAGT GGTTTTGCAT GAAAGCTGCA AAGCAAGCAG GTTTAGAAGT ACCACGTATC 
TTTCTCTCCG AAAATTATCA ACTGCTTATT CTGGAGCGTT TCGACCTTTT AGAAGATGGA 
ACCTATCTTG GATTTGAAGA TTTTTGCGCT TTACATGGAT TAAGTACGTT TGAAAAGTAT 
GATGGTAGTT ATGAACGCGT AGCGAAACGC ATAACACAAT TTGTAAGCCA AGAGCATCGC 
CAAAAAGCAT TCGAAGAGTA TTTCAAAATT GTTGCTCTTT CATGTGCTGT ACGTAACGGC 
GACGGGCATC TTAAAAATTT TGGCGTCCTT TATTCCAACA CCACAAGCGA TGTATGGCTC 
TCTCCAGCAT ATGATATTGT TTCAACAACC CCCTACATTC CACGAGACTC GTTAGCATTA 
ATGTTAGATG GCAGTAAACG TTTTCCTTCT CGAAAAAAAC TCTTGAATTT TGCCCGTCAA 
CACTGTAACC TACAACACGA GCAAGCTACC GAAATGATGG AAAAGATAGG TGATGCCGTT 
AATGAAACAA TGGCTGAAAT AAAAGTACAG ATAAAGGAGT ATTCTCCATT CGCATCAATC 
GGCAATAGAA TGCTTAGCAC ATGGAATGAA GGAATAATAG ATCTCAATGG GAAATCCACC 
ATCTCGTTCT CTACATAA

Protein sequence

MLDVQVSHNS VGTLAHHTSE QGSYTFAYHK AIDIGQEVSL TMPWSLASYH YRKGLHPIFQ 
MNLPEGRLRY TLERAFRKQA QGFDDLMLLD IIGHSQIGRL HCTSNPQLPK SVPLQSINEL 
LAYNGTEDLL RDLLERFSAT SGISGIQPKV LICDPNQAAL GAKFPTHHSP QLTNAQARIT 
VKGATHIVKG WDENEYPHLA LNEWFCMKAA KQAGLEVPRI FLSENYQLLI LERFDLLEDG 
TYLGFEDFCA LHGLSTFEKY DGSYERVAKR ITQFVSQEHR QKAFEEYFKI VALSCAVRNG 
DGHLKNFGVL YSNTTSDVWL SPAYDIVSTT PYIPRDSLAL MLDGSKRFPS RKKLLNFARQ 
HCNLQHEQAT EMMEKIGDAV NETMAEIKVQ IKEYSPFASI GNRMLSTWNE GIIDLNGKST 
ISFST