Gene Cag_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0020
Symbol
ID	3747890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	19790
End bp	21253
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	50%
IMG OID	637772544
Product	hypothetical protein
Protein accession	YP_378342
Protein GI	78188004
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACGCC CGATGAGTGC CCCAAATAGT GCCCTAATGA GCTCCAAAAT TAGTTCCCCC 
ATCAGTCCAA CAACTCTCCA TCATCTGCTT GATATTCCGC TTACTACGCC GCTTACGCTG 
GAGGCAATGT GCCGCAATCT TCGTCCAATT TACTATCCTG CGCCGCACCT ATCGCCACGC 
TTAGAGCGCT TTAGCTTGGC GCTGGTAGAG GCAATGCAAG GCTTGGGCAT TCAGGTGCAT 
TCGCCAGAGG AGTTGGCACT ACACGATGGG CGTTTTCCTG CTGGCACGGT GATTGTTGCG 
CCGGGTATTT TTGATGATGA TGCGCTGCCG ATTAACCGCG TCAGTACGCT TTACAACAAC 
ATTATTGTTG GCATTTACGA TGAAGCTGCA CCCGTATCGA ACAGCTCATT GCCGCAAGAG 
CGGCTTGATG CGATTGTGGG GCGTTTAGCT CGCGATATGG TGCATATTTT AATTTTTGTA 
ACCGATGAGT CGTGGACAAT TTGCACCATG AATGGCGGCA TTGCAACCTT TGCTACGCCA 
CTGCCACACG TTGCGGATGT GCGCTCTACG TTGGTTCCAA AACTAACGGC GCAAGTAGTT 
CCACCCAGAA ATGAGGCGTT TACTTTTGTT GATGGAGCGT TGGATATTGC CTCACCAACG 
TTTAGCGCAA TTGCAGAGGA TTTTGTGCAG TGCAGTGCCT TGTGGAGCCA AAGCAGTGCG 
CTCCTTACGC ACACTTCAAC CGAAGGGTTA CACTACCGCA ATTCATTTTA TAAACGTATT 
GTTGCTCGCT ACCTTGATGA GCGCAGTGGT ATGAGCTATG GCTTTTTTGC ACGCCAATTG 
CCTATTCCTA CGCTTCAACC CGCTCAAAAA AAGAAGGCTG ATGGATTGAT GGAAGTACAG 
CTTGCAGGTG AGCAATGGTT TGTAGCAATT CCAGAGGTAA GCATTATTAC CACGCGCTCG 
GGATGCCGCA AGCATTGCTT AAATCCGCTG GAAGATTTAG TAGCTCTTGG CTTAAAAGAG 
GAGCAGGGGA AGCGAGTTGC CTCCATTACC ACACCGTCAA CTTCGTGCAA CACCGTTATT 
AAGCCCTCGT TTGATACGTT GGCAATTCTT GCCCATGCGT TGGGCAATGC TATTGTGGGG 
AGCATTTTGT TGGTACTTCA GCCCAATGCG CCTTTTTCCC GCCATCTTGC ACGTAACGGT 
GCTACCATTA CCCATTGGCA CGGTTATCCG CAAAAGAGCG ATCTTCCCGA TGGCTATTGG 
TTGCATGGTG CCGAAAATCC GCCCGTAGCC TGCTCAACCC CGCAATCTGC CGCTTACAGT 
TTACTTGGCA AACTTAGTGC TCTTGAGCAA GCGCTCACGC AACAGGGCAT CTATCACGGC 
GATGTTCACA CCGAACCGCA TCACGGCACC AACATTGTCG GCATTCTTTC CCTTACCGAG 
GTTGCTCGCC ATTTTGCAAG ATAG

Protein sequence

MERPMSAPNS ALMSSKISSP ISPTTLHHLL DIPLTTPLTL EAMCRNLRPI YYPAPHLSPR 
LERFSLALVE AMQGLGIQVH SPEELALHDG RFPAGTVIVA PGIFDDDALP INRVSTLYNN 
IIVGIYDEAA PVSNSSLPQE RLDAIVGRLA RDMVHILIFV TDESWTICTM NGGIATFATP 
LPHVADVRST LVPKLTAQVV PPRNEAFTFV DGALDIASPT FSAIAEDFVQ CSALWSQSSA 
LLTHTSTEGL HYRNSFYKRI VARYLDERSG MSYGFFARQL PIPTLQPAQK KKADGLMEVQ 
LAGEQWFVAI PEVSIITTRS GCRKHCLNPL EDLVALGLKE EQGKRVASIT TPSTSCNTVI 
KPSFDTLAIL AHALGNAIVG SILLVLQPNA PFSRHLARNG ATITHWHGYP QKSDLPDGYW 
LHGAENPPVA CSTPQSAAYS LLGKLSALEQ ALTQQGIYHG DVHTEPHHGT NIVGILSLTE 
VARHFAR