Gene Cag_0194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0194
Symbol
ID	3746681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	220889
End bp	222049
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	47%
IMG OID	637772721
Product	hypothetical protein
Protein accession	YP_378515
Protein GI	78188177
COG category	[S] Function unknown
COG ID	[COG3876] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGTTA CGGGTCTTGA CGTATTATTG CGTAACCTTG ATATGTTACG CCACCGTTCG 
GTAGGGTTAC TTGTGAACCA AACCTCACTT ACTGCCTCAA TGGAATATTC ATGGCAGCTT 
TTGCAAAAGC AAGGCATCAC CATACGGCGC ATCTTTTCAC CTGAGCATGG CTTGTTTGCT 
ACCGAGCAAG ATCAAATTGC GGTAAGCTAT CAGCCTGAAC TTGGTTGCGA TATGGTAAGT 
CTTTACGGCG ATTCCGCTGC AACGTTGGTG CCCGATATGG CGTTGTTGGA TGATCTTGAT 
GTGGTGATTT TTGATATTCA AGATGTTGGG GCGCGTTATT ACACCTACGT AAATACTTTA 
GCGCTCTTTA TGGAGGCAAT TGCAGGGCGC GATATTGAGC TGATGGTGCT TGATCGTCCG 
AATCCTCTCG GTGGAGAAAT TGTGGAAGGT CCAATGCTCG ATATGGCATT TGGTTCCTTC 
GTGGGCGTTT TTCCCGTACC TGTTCGCCAT GCGTTAACGG CTGGTGAATT AGCTGTGCTT 
TATCGTGATG TTATGCAGCT TGATGTTAAT CTACGCATTA TCAAAATGGA GGGATGGAAG 
CGCACTATGC TGTATGGTGA AACAGGTTTG CCTTGGATTC CACCTTCGCC CAATATGCCT 
ACGGTTGCTA CGGCTGAAGT CTATCCCGGC ATGTGTTTGT TTGAGGGATT AAATGTGTCG 
GAAGGGCGAG GCACTACCAC ACCATTTCAA CTCTCAGGGG CACCATTTAT CCATCCCATT 
GAACTTGCTG AACGCTGCCA CTCCTATGGA TTGGAGGGTG TGCGCTTTCG TCCTGTCTGG 
TTTAAACCAA CCTTCCATAA ATTTGCAGGT GAGGTAATTG GTGGCATTTG GCAGCAAGTA 
ACCGATGCGC GACGTTATCG CTCATTTGCA ACGGCAGTTG CTATGACGGC AGCGCTTCGA 
GAGCTTTATG GCGAACAAGT AACCTTTTTA CGTGGTGTTT ATGAATTTAA CGATACCATT 
CCTGCCTTCG ACCTTTTAGC TGGTAACGCC ACTATTCGCA CAGCCATTGA GAGCGGCAAC 
ACTATCCATA CTCTTCTCAC CTTATGGCAA AAGGATGAAG CACAATTTGC CGAAACTAAA 
ACTCGCTATC ACCTCTATTA A

Protein sequence

MIVTGLDVLL RNLDMLRHRS VGLLVNQTSL TASMEYSWQL LQKQGITIRR IFSPEHGLFA 
TEQDQIAVSY QPELGCDMVS LYGDSAATLV PDMALLDDLD VVIFDIQDVG ARYYTYVNTL 
ALFMEAIAGR DIELMVLDRP NPLGGEIVEG PMLDMAFGSF VGVFPVPVRH ALTAGELAVL 
YRDVMQLDVN LRIIKMEGWK RTMLYGETGL PWIPPSPNMP TVATAEVYPG MCLFEGLNVS 
EGRGTTTPFQ LSGAPFIHPI ELAERCHSYG LEGVRFRPVW FKPTFHKFAG EVIGGIWQQV 
TDARRYRSFA TAVAMTAALR ELYGEQVTFL RGVYEFNDTI PAFDLLAGNA TIRTAIESGN 
TIHTLLTLWQ KDEAQFAETK TRYHLY