Gene Cag_1584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1584
Symbol
ID	3746659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2068000
End bp	2069238
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	44%
IMG OID	637774124
Product	heterodisulfide reductase, subunit A
Protein accession	YP_379882
Protein GI	78189544
COG category	[C] Energy production and conversion
COG ID	[COG1148] Heterodisulfide reductase, subunit A and related polyferredoxins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00494789
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGTTG AAACCATTGT AATCGTCGGC GGTGGCATCA GTGGAATTAC CACAGCAGTT 
GAGGCTGCTG AAGTTGGCTA TAACGTCATT CTTGTTGAGA AAAACGCTTA CCTCGGTGGA 
CGAGTAGCGC AGCTTAACAA GTATTTCCCC AAATTGTGCC CCCCCTATTG CGGTCTTGAA 
ATGAATTTCA GACGCATTAA GCTTAATCCG AAAATTACCG TTTATACCCT GACCGAGGTA 
GAAAATGTAA GCGGCAAAGA GGGTGACTAT AGCATTAAGC TTAAAGTCAA TCCGCGCTAT 
GTGAACGAAA AGTGTACAGC GTGCAATGCC TGCGCAGAAG TATGCCCTGC GGAACGCTCT 
AACGACTTTA ATTTTGGGAT GAATAAAAGC AAGGCTATTT ACTTGCCGCA TGAGCTTGCT 
TATCCCACTA AATATGTAAT TGATCGGAAA GCATGTGCCC AATCCTGCGA CAAATGTGTT 
AAGGCTTGTG TATATAATGC TATAGATTTA ACCATGAAGC CTGAAACCGT TGAGGTAAAA 
GCTGGCAGCA TTGTGTATGC AACGGGCTGG AATCCTTACG ATGCAACTAA AATGCAGAAT 
TTGGGCTTTG GGCGTGTAAA AAATGTTATC ACCAATATGA TGATGGAGCG TTTAGCAGCG 
CCTAACGGTC CAACAGGTGG TAAAATTGTT CGTCCATCGG ATGGGCGCGA AGTAAAAAAG 
GTTGTTTTTG TGCAATGTGC AGGCTCTCGT GATCAAAACC ACTTGAACTA CTGTTCGGCT 
ATTTGCTGTA TGGCATCACT CAAGCAAGCA ACCTACATTC GCGATCGCTA TCCTGATGCT 
GATATTATGA TAGCCTATAT TGATTTACGC ACACCCGGTA AGTATGAGGC GTTTTTAAAT 
AAAGTTGAAA ACGATAAACG CATTCGCTTA GTAAAAGGCA AAGTTGCGCA AATTGAAGAA 
GATCGTGCTA CAGGCAACGT TATTCTCACC TCAGAAGATG TTGAAGGTGG CGGCAAAAGT 
ACTTATGAAG CCGATATGGT AGTGCTTGCA ACGGGTATGG CTCCATCGGT AAGCGATCAT 
CCCATGCTTG CTTTTGAGCA AAATGGATTT ATTCAGGGTG GCAAAGCGGC TGGTATTTAT 
TCTACCGGTG TAGCAAAACG TCCTTCTGAT GTTACAACCT CTCTTCAGGA CGCAACCGGC 
GTCGCATTGA AAAGCATTCA AAGTTTGGTA AGGAGTTAA

Protein sequence

MSVETIVIVG GGISGITTAV EAAEVGYNVI LVEKNAYLGG RVAQLNKYFP KLCPPYCGLE 
MNFRRIKLNP KITVYTLTEV ENVSGKEGDY SIKLKVNPRY VNEKCTACNA CAEVCPAERS 
NDFNFGMNKS KAIYLPHELA YPTKYVIDRK ACAQSCDKCV KACVYNAIDL TMKPETVEVK 
AGSIVYATGW NPYDATKMQN LGFGRVKNVI TNMMMERLAA PNGPTGGKIV RPSDGREVKK 
VVFVQCAGSR DQNHLNYCSA ICCMASLKQA TYIRDRYPDA DIMIAYIDLR TPGKYEAFLN 
KVENDKRIRL VKGKVAQIEE DRATGNVILT SEDVEGGGKS TYEADMVVLA TGMAPSVSDH 
PMLAFEQNGF IQGGKAAGIY STGVAKRPSD VTTSLQDATG VALKSIQSLV RS