Gene Cag_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1024
Symbol
ID	3746752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1378520
End bp	1380037
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	33%
IMG OID	637773553
Product	hypothetical protein
Protein accession	YP_379329
Protein GI	78188991
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCGC TACCCGTAGG CATACAAACA TTCAGTAAAA TAATCGAGGA CAATTATCTG 
TACATTGATA AAACAGATAT AGCAAAAAGC ATAATAGAAA AATATCAATA TGTTTTTCTA 
TCACGTCCAC GACGATTTGG AAAGAGTTTG TTTCTTGATA CGCTCAAAAA TATTTTTGAA 
GGCAAACAAG AGCTTTTCAA AGACTTGCTT ATTTACAACC AATGGAATTG GGCTGTAACT 
TATCCCGTTA TTAAAATAAG TTTTAGTGGT GGTATTCACT CCAAAGCTGA TCTCGAAGAA 
GATTTAATAC AAATACTGAA GGCGAATGAA AAACGGCTTG ATCTAAAGTG CGAAAATCGC 
TCAAAAGCAA AATACTTTTT TGCTGAGTTG ATTCAACAAG CTTCTGAAAA GTATCAACAA 
AGCGTTGTTA TTCTCATTGA CGAGTACGAT AAACCAATTC TCGATAATAT TGAAAATATC 
CCTGAAGCAC TCATTATCCG TGATGGAATG CGAGACTTTT ATACCAAAAT AAAAGAGAGT 
GATGAATATT TACGTTTTGT TTTTCTTACA GGAGTAAGCA AATTTTCAAA AGTATCGCTT 
TTTAGTGGTT TAAATAATCT TGAAGATATT AGCCTGAATT CCGATTTTGG TAACATTTGT 
GGTTATACAC AAAACGATGT TGATACCACT TTTGCACCCT ATTTTGAAGG CGTGGATATG 
GAAGAGGTGA AACGCTGGTA TAATGGATAT AATTTTCTTG GTGATAAAGT CTATAACCCA 
TTTGATATAC TCCTTTTTAT TAAAAACCAA AAAATGTTCA GAAACTATTG GTTTGAAACA 
GGCACACCAC GATTTCTGAT TGAGCTTATC AAAAAAAACA ACTATTTTGT TCCCAACTTA 
AATAAACTGC GAATTAATGA ATCCTTAGCG AATAGTTTTA ATCTTGAAAA TCTTAATTTA 
GAAACAATTT TATTTCAAGC AGGCTATTTG ACTATTAAGC GATTGATTTC TACTAACAAA 
GGTGTTAGCT ATGAGTTGGG ATTTCCTAAC AAAGAGGTGC AAATTAGCTT TAACGATTAT 
CTTTTGCAAG AATTAACTAC TGTTTCGGAA AATGAGCTAA TTTGCGATGA TCTTTTTGAA 
CTTTTCAATA ATGGAGATAT TGCCAATTTA GAACCCGTTA TCAAACGACT TTTTGTAAGT 
ATTGCTTATA ATAATTTCAC CAACAACTAT ATTGAGAGTT ATGAGGGCTT TTATGCAAGT 
GTGCTCTATG CTTATTTTGC AAGTCTTGGG TTTGATATGA TTGCTGAAGA TATCACCAAT 
AAAGGCAGGA TTGATTTAAT CCTTAAAACC TTCGATAAAA CCTACATCTT TGAATTCAAA 
GTAATTGCAG AGGAGCCGCT TGAGCAAATC AAAAAGATGA AATATTACGA GAAGTATGAT 
GGTGAACGTT ATCTCATTGG TATTGTTTTT GATCCGAAGG CAAGAAACGT CAGTCAATTT 
GCGTGGGAGA GGGTTTGA

Protein sequence

MKPLPVGIQT FSKIIEDNYL YIDKTDIAKS IIEKYQYVFL SRPRRFGKSL FLDTLKNIFE 
GKQELFKDLL IYNQWNWAVT YPVIKISFSG GIHSKADLEE DLIQILKANE KRLDLKCENR 
SKAKYFFAEL IQQASEKYQQ SVVILIDEYD KPILDNIENI PEALIIRDGM RDFYTKIKES 
DEYLRFVFLT GVSKFSKVSL FSGLNNLEDI SLNSDFGNIC GYTQNDVDTT FAPYFEGVDM 
EEVKRWYNGY NFLGDKVYNP FDILLFIKNQ KMFRNYWFET GTPRFLIELI KKNNYFVPNL 
NKLRINESLA NSFNLENLNL ETILFQAGYL TIKRLISTNK GVSYELGFPN KEVQISFNDY 
LLQELTTVSE NELICDDLFE LFNNGDIANL EPVIKRLFVS IAYNNFTNNY IESYEGFYAS 
VLYAYFASLG FDMIAEDITN KGRIDLILKT FDKTYIFEFK VIAEEPLEQI KKMKYYEKYD 
GERYLIGIVF DPKARNVSQF AWERV