Gene Cag_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0844
Symbol
ID	3746803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1175145
End bp	1176338
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	52%
IMG OID	637773373
Product	hypothetical protein
Protein accession	YP_379152
Protein GI	78188814
COG category	[S] Function unknown
COG ID	[COG4924] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTGGA CAACCCCCGC CGAACTGAAA CGTCAGGTGC AAAAGCTCTG GGATCGAGGC 
ATGTTGCTTG CCACCTTTTG TAATGGTAAG GCACTATTTC CCCGTCGCCT CATGCTGAAA 
GCGCCTGATG CCCGCCAATT GAGTACCTCC TTTCCCGAAG TGCGCGAATG GATTGCCCAA 
CTTTCAAATG CAGCAAAACA CTACCGCATC GTATGGCGCA CCATCAACCA CCGCATTTTG 
GGAGCAAATG AACTTCCTGC TGAAATTTGG ATTGATTCGC TTGACAATGC ACTCTTGCTG 
ATTGGCAAAC AACGAGAAGC TCAGCAGTTT GCCGCCATGG TTACGCTTAC CCGCACCATG 
CAACCCGCTC TTCTGCCATG GCTTGAAAAA CGCCCGTTAC GTGCGCTTGA ATTAGCCCCA 
GAGTGGCATC GCCTGCTCTC CATTGTGGCA TGGCGCATAA CACATCCAAA ACCAGCAATC 
TACCTGCGCC AAATTGACCT GCCCGGCATC CACAGCAAAT TTATCGAACA GCACCGAGGC 
GTACTTGGGG AACTCTTCGA TCTTGTCCTT CCTCCGGAAG AGATTGATAC CACAGCGATT 
GGTGTTGGAG GATTCTGCCG CCGTTACGGC TTTCAGGACA AACCCCTGCG TGTTCGCTTC 
CGCATTCTCG ACCCAGCACT CGCGCTGCTG CCGACGGTCA GCGATCACGA TATTACCGTA 
ACGCAAGCAA CCTTTGCCTG CTTAGAAATA GCGGTTACAA AAGTCTTCAT CACCGAAAAC 
GAAATCAACT TTCTCGCCTT TCCCAATGTT CCGCAAGCAA TGGTGATTTT TGGAGCTGGC 
TATGGTTTTG AAAATTTAGC CTCAGTCAAA TGGTTGCATG ATTGCGCTAT CCATTACTGG 
GGCGACCTTG ACACCCACGG CTTCGCCATC CTCAACCAAT TGCGCAGATT CTTTCCACAT 
GCAACCTCGT TTCTAATGGA TAGCAAAACG CTGATGGAGC ATCAAGCGCT TTGGGGCATT 
GAACCGTCTC CCGAAACCGG CGAACTCACG CGACTGACCG CTGAAGAGAG TGCGCTGTAC 
GATCAGTTGC GGCAGAATGA GTTAGGTCAT CACATTCGTT TAGAGCAGGA GAGGATTGGG 
TTTGAGTGGC TGGTTGGGGC GCTGGGGAGG GGGACAGAGA AAGCGGCTGT TTAA

Protein sequence

MSWTTPAELK RQVQKLWDRG MLLATFCNGK ALFPRRLMLK APDARQLSTS FPEVREWIAQ 
LSNAAKHYRI VWRTINHRIL GANELPAEIW IDSLDNALLL IGKQREAQQF AAMVTLTRTM 
QPALLPWLEK RPLRALELAP EWHRLLSIVA WRITHPKPAI YLRQIDLPGI HSKFIEQHRG 
VLGELFDLVL PPEEIDTTAI GVGGFCRRYG FQDKPLRVRF RILDPALALL PTVSDHDITV 
TQATFACLEI AVTKVFITEN EINFLAFPNV PQAMVIFGAG YGFENLASVK WLHDCAIHYW 
GDLDTHGFAI LNQLRRFFPH ATSFLMDSKT LMEHQALWGI EPSPETGELT RLTAEESALY 
DQLRQNELGH HIRLEQERIG FEWLVGALGR GTEKAAV