Gene Cag_1606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1606
Symbol
ID	3746471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2096888
End bp	2098261
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	49%
IMG OID	637774146
Product	hypothetical protein
Protein accession	YP_379904
Protein GI	78189566
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.372312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTACAA GTGGCGCAAT TGCTAGCCTT GATGCTTTTC TTCATCGTTG GAAAGCTAAA 
GCGGGCAATT ACACGGGCGA TTACATTACA ACGCCTGAAG GGTTAGTTCG CAATAATATG 
GATGATGAGC AAGGGCGCGG TGGCTACTAT CAGGAGTACG CCTGCACGTC GGAGAGCCAA 
GTGATGATGG CGCGTGGTTA CCTTCGTGCC TATCAAGCAA CGGGCGAAAG CCGTTATTTG 
CAAAATGCTC GCACGGCAAT GCAGGCGCTG ATTCGCTACT TCTTTTTCGG CAAAGTTCCC 
TCCACTGCAA CGGCGTGGCG TTCGCATTGG ATTGTTAATG CGGGTGCTCC CTTTAAATCA 
AAAGAGAATG GGCGCACAAC CGATACCATT GCTTTTGGTG AGGCATACGA GTGCTGGCCT 
ACTTGGCGCA AGCTTCGCCC CAATGAATTT GCCACTGCTG GCGATTCCAT GCACTGGTTT 
ATTGAGAACT TCCACCTCTT TTCGCAGCTT GAAACAGAGG ATCAAAAAGG GCAATGGCTT 
GCAGCACGCG ATGCCATGTT TCGTGAATTT AAGCTGCTGC TCTCCCCAAA ATGGCAAGCG 
AAGTACAAAG GAGCTATTCC TTTTGAATAC ACCAATAAGG GGGATAATCT AACTGTGCGT 
TCCACCTCAA TTTTTAGAGG ACCCTATTAC ACGGGATACC AAAATCCCCT ACCATGGCTC 
TACATGCAGG ATTACACCGC AGCGGCAAAC ATGCTGCAAC TCTTGGTGGA GTCGCAAGTG 
GCTTATACCA AAAGCACGGG GGTAAAAGGT CCTTTTGCAC CAGTTTACCA TTACGATGCT 
TCGCTGCTTG GTTCCGCAAA GAAAAATGTT TTTACATGGA ATGGACCTGA TCCCAACACC 
TTTTGGGGTG GTTTTCAATA TCGTCCCTTT GCCGATGTTG CTCATTTTTG GTACCACTGT 
AAGCGCTCCA ATATTCAAAA TGCCGCGGTT AGCAATGCCT CAAAAGTGTG TATGAGCTTT 
TTAAGCTGGT TGGATGGCTG GCTTACCGCT CACCCCAATA ATGAATATGT ACCTACCGAA 
TTCCGCGAAG CTACACAGCC CAGCGCACCA CCTGCCAATG GCGATAACGA TCCCCACATG 
ATTGCCCTTG CGCTGAAAGG GGCGCTCTTT TGCAAAAATG CGGGTGCTGA TGCCGCAATG 
GTTGGGCGCG TTATTGCGCG CTTGTACGCT ATGGTGATGA AGCGCCAAAG CAAAGCGGGC 
GATATGGCTG GAGCTTTTAT GCACGATCCC TACAGCCATA TTTTTAAAGG ATTTTGGGCT 
GGTGATATTA TGGAGGCTTT AGCGCTCTAC ATAATGCACC ACGAAAAAGG ATAA

Protein sequence

MSTSGAIASL DAFLHRWKAK AGNYTGDYIT TPEGLVRNNM DDEQGRGGYY QEYACTSESQ 
VMMARGYLRA YQATGESRYL QNARTAMQAL IRYFFFGKVP STATAWRSHW IVNAGAPFKS 
KENGRTTDTI AFGEAYECWP TWRKLRPNEF ATAGDSMHWF IENFHLFSQL ETEDQKGQWL 
AARDAMFREF KLLLSPKWQA KYKGAIPFEY TNKGDNLTVR STSIFRGPYY TGYQNPLPWL 
YMQDYTAAAN MLQLLVESQV AYTKSTGVKG PFAPVYHYDA SLLGSAKKNV FTWNGPDPNT 
FWGGFQYRPF ADVAHFWYHC KRSNIQNAAV SNASKVCMSF LSWLDGWLTA HPNNEYVPTE 
FREATQPSAP PANGDNDPHM IALALKGALF CKNAGADAAM VGRVIARLYA MVMKRQSKAG 
DMAGAFMHDP YSHIFKGFWA GDIMEALALY IMHHEKG