Gene Cag_0861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0861
Symbol
ID	3747571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1193843
End bp	1195441
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	49%
IMG OID	637773390
Product	hypothetical protein
Protein accession	YP_379169
Protein GI	78188831
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG0645] Predicted kinase [COG2187] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00795594
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAACC TTGCTGAAGC CCTTTGCCAC CCCGAAGCTT ACCCTCATGC ACCGCAAAGC 
GTGGAGATGG TGCAAACCCA CTGCTCATGG GTTTTTTTAG CGGGAGCGTG GGCATATAAA 
GTAAAAAAGC CGCTTGACCT TGGTTTTCTT GACTTTTCAA CGCTTGAGTT ACGCCGCCAC 
TTTTGCTACG AAGAGCTACG CCTTAACCAG CGCCTCTGCT CCACTCTGTA TCTTTCAGTT 
GTGCCAATTG TTGCTGTTCG GCAGCAGATC AAGGTTATTG ATAAGGAGAA TAATACGGAT 
GAACATTGGA ACGAAGAGGA AAACAATGAG CATGGCACCA TAATTGACTA TGCGGTAAAA 
ATGGTACGCT TTGACCGCAC GCAAGAGCTT GATCGCTTAT TGGCGCACCA CAAACTTGAT 
GTTAAGCAGA TGGAGCAACT TGCCCGTACC ATTGCTGCAT TCCATAATTC ATTACCAGCA 
GCTCCAATGG ATAGCGCATT AGGGCATCCC GACACCATTA TTAAGCCCAT GTTGCACAAT 
TTCACCTTGC TTGAGGATAT TGTGGTGGAG AGCGAGGAGC AGCAAGAGTT AGCCACCTTA 
CATCAAGCCA CCCTGAGCGA CCATCAGCGC CTTTACCAAC GGTTGCTTCA GCGCAAAGCG 
GATGGCTTTA TTCGCCAATG CCATGGCGAT TTACATACAG GCAATATGGT GATGTGGCAA 
GGGCGCATTA CGCTATTCGA TTGCATAGAA TTTAACCCAA CGCTCAACAC CATTGATTGC 
ATCAGCGATC TCGCCTTTCT TTTTATGGAT TTACGCCATA GCGGCGAAAC GGCTTTAGCA 
TGGCGACTTT TAAACGGCTA CTTGATGGAA ACAGGCGATT ACCACGCCTT AGCGCTTCTC 
CCCTTTTATG AACGTTACCG CGCAATGGTA AGAGCCAAAG TAACTGCTAT TCATGCCTCG 
CAAAGCAAAG ATGCGCCTGA AGTGAGCAGC TTAATGGCAG AGCACCGTAG CTACGTTGCG 
CACGCCACAA ACTGTACCAA GCACAATCAG CCAATGCTCC TGATAGTGTG CGGTTTGTCA 
GGAAGCGGCA AAAGCACCCT TGCCGCTTCA ATTGCCTCAG AACTGCCAGC AATTCACCTC 
CGCTCCGATG TTGAGCGCAA ACGCCTTGCA GGGCTTCGCC CGCTTGAACG TAGCCCAAAG 
AGCGACCTTT ACAGCCACTC CATGACTAAC AACACTTATG CACACTTATT GGGATTAGCA 
CGATTTTGCT TGTTGGAAGG CTACTGCGTT GTGGTGGATG CCACCTTTTT GCGCCAAAGC 
AATCGAGCAC TTTTTACAAC ACTTGCCAAT GAATGTAACG TACCATATCG CCTACTCCAC 
TGCACTGCCC CAAAGCAGGT GCTGATGGAG CGTGTACAAT TACGCAACCT TGAAGGCAAC 
GATGCCTCCG ATGCCGATGC GGAAGTGGTT GCCATGCAGC TTGAGCAGCA GGAAGCGCTG 
ACGGATGACG AAAAAAAAAT TACAATAACG ATTGATACGA CCCATCCCAT TAACGCAACC 
GCTCTTACGG GAATGTATCA ACTAAAGAGA GAACATTAA

Protein sequence

MINLAEALCH PEAYPHAPQS VEMVQTHCSW VFLAGAWAYK VKKPLDLGFL DFSTLELRRH 
FCYEELRLNQ RLCSTLYLSV VPIVAVRQQI KVIDKENNTD EHWNEEENNE HGTIIDYAVK 
MVRFDRTQEL DRLLAHHKLD VKQMEQLART IAAFHNSLPA APMDSALGHP DTIIKPMLHN 
FTLLEDIVVE SEEQQELATL HQATLSDHQR LYQRLLQRKA DGFIRQCHGD LHTGNMVMWQ 
GRITLFDCIE FNPTLNTIDC ISDLAFLFMD LRHSGETALA WRLLNGYLME TGDYHALALL 
PFYERYRAMV RAKVTAIHAS QSKDAPEVSS LMAEHRSYVA HATNCTKHNQ PMLLIVCGLS 
GSGKSTLAAS IASELPAIHL RSDVERKRLA GLRPLERSPK SDLYSHSMTN NTYAHLLGLA 
RFCLLEGYCV VVDATFLRQS NRALFTTLAN ECNVPYRLLH CTAPKQVLME RVQLRNLEGN 
DASDADAEVV AMQLEQQEAL TDDEKKITIT IDTTHPINAT ALTGMYQLKR EH