Gene Cag_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0033
Symbol
ID	3747002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	34929
End bp	36197
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	35%
IMG OID	637772557
Product	hypothetical protein
Protein accession	YP_378355
Protein GI	78188017
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAGGCG CTTGGCGAAA TATCACATGG ATATTTATGA ACTCACGTAC AAATATACTC 
ATGCCATTGA CCAATGCTCG TGGATTAGGC AAAGTAACAT TTTTTACTGG CTTGGATTTT 
CCTATTGTTA TGAAACCAAG TTTAATGGGG GAACCTGTAT TAACCGCGCA AGCCTTTTAC 
TTTCTAGAAA GGCTTGACTC AGTTGTGACT GCAAGTTTTC CAAGCAATAA GGTTCCATTA 
CCTCATGAAA TAGACTACAT TATTGATAAT TACCTATTTG AGTATTCAAA AAGGCATCCT 
GACAAAAAAA TAACATCAAA AATAACTGAG TTTGTGTTTT GGCAAGAAGA CCCAGACAAT 
GCTTATTTTT CATATGACTG GAAACTTACA GAATGTTTGG TATTAGACAC TTTGAACGAC 
ACATCCATTA TTGATTGCAA CGACCCCAAA CGTACAATGG GGGAAATCTT TGATTGGTGT 
TTATATAAAC CATATTTCGA AGACGCTTTA GAAGAGTACA AAAACAAACT CGAAGAAGCC 
GCAAAATATG TGGCGAATGT CAAAACGCAG AATCACTCGA GTTTGGGAAC TGGAGAATAT 
CAACTTCCTA TAATTCGCGT TAATTCAAAA CCATTAACAC TTGCGCAAGT TAACATGCTG 
GAGGTGGTTT CAGCAGACAG AAAAATTGAT TTAACATCTG ACACGTACGA AGTTAATCGC 
GGAATGAAGT CAAGCACTAA TTACTTTTTA CCTCAAGAAG TAATAACCGT AAACAATCGC 
CACAACCCAC AGTTATTAGC CTATTACTTT AGTGCTGTGA GAGATTACTC TCCAATTTCC 
CAATTCAAAA ACTACTATAA TGTGCTTGAG TATTTTTTTG AAGAAGCCCC GAATCATCTA 
GGTATAACTG CAAAAACAGA AGCCGAACAA ATAATTGCGG TATTAAAATT ATTTATAGAC 
CCTGTTGAAT TGAATAAAAA ATTCAATGAA ATAGACAAGG CAACACTTGC GCTAATTGAG 
AAACCTCAAA TAACCTCTAG TGGTGAAAAT ATAGCAGGTA TAGATTTTTC CGTTACAGAT 
ATTCTTGCAG AATATGGACG GCATATTTAC CAGATAAGAA ATGCGTGCAT TCATTCAAAA 
AAAACTCGTA AAGGCAAATC TACACCAAGA TTCATCCCAT CATATGATGA GGAAAAGATT 
TTAGAATACG AAATGCCCAT ATTGCAATGG ATTGCGATTC AATGCATTGA AAAAGAAAGT 
ATTATTTAA

Protein sequence

MLGAWRNITW IFMNSRTNIL MPLTNARGLG KVTFFTGLDF PIVMKPSLMG EPVLTAQAFY 
FLERLDSVVT ASFPSNKVPL PHEIDYIIDN YLFEYSKRHP DKKITSKITE FVFWQEDPDN 
AYFSYDWKLT ECLVLDTLND TSIIDCNDPK RTMGEIFDWC LYKPYFEDAL EEYKNKLEEA 
AKYVANVKTQ NHSSLGTGEY QLPIIRVNSK PLTLAQVNML EVVSADRKID LTSDTYEVNR 
GMKSSTNYFL PQEVITVNNR HNPQLLAYYF SAVRDYSPIS QFKNYYNVLE YFFEEAPNHL 
GITAKTEAEQ IIAVLKLFID PVELNKKFNE IDKATLALIE KPQITSSGEN IAGIDFSVTD 
ILAEYGRHIY QIRNACIHSK KTRKGKSTPR FIPSYDEEKI LEYEMPILQW IAIQCIEKES 
II