Gene Avin_30370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_30370
Symbol	cycH
ID	7761937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3148536
End bp	3149753
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	73%
IMG OID	643805909
Product	cytochrome c biogenesis protein
Protein accession	YP_002800177
Protein GI	226945104
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4235] Cytochrome c biogenesis factor
TIGRFAM ID	[TIGR03142] cytochrome c-type biogenesis protein CcmI

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGATT TCTGGATCGC CGCCGGCCTG CTGCTGCTGC TGGCCCTGGC CTTTCTGCTG 
CTCCCCGTGC TGCGCACTCG TCGCGCCCAG GCCGAGGAGG ACCGTACCGC GCTCAATGTG 
GCGCTCTACG AAGAGCGTCT GGCCGAGCTG GACGCCCAAC GCGCGGCCGG CACCCTGAGC 
GCCGGGCAAC TGGAGGCCGG CCGCGCCGAG GCGGCCCGCG AGCTGCTGGC CGACACCGAA 
GCCGGCGAGG CGCCGCGCCG CTCCTCCTTG GGCAGGGCGG TGCCGCTGGC GGTGGCGCTG 
CTGGTGCCGC TGCTCGGCTA CGGCCTCTAC CTGCACTGGG GCGCCAGCGA CAAACTCGAA 
CTGGCCCGCC GGTTCGCCGA ACAGCCGAAG AGCATCGAAG AGATGACCGC GCGCCTGGAG 
CAGGCGGTCA AGGTCCAGCC GGATTCCGCC GAGGGCTGGT ATTTCCTGGG GCGCACCTAC 
ATGGCCGAGG AGCGTCCGGC CGACGCCGTA GCGGCCTTCG AGCAGGCCGC CCGGCTGGCC 
CAGCGGCCGC CGGAGATCCT CGGCCAGTGG GCCCAGGCGC TGTATTTCGC CGAGGGCAAG 
CGCTGGAGCC CGCGGATGCA GGCGCTGACC GACGAGGCGC TGGCCGGCGA GCCGGCCGAG 
GTCACCAGCC TCGGCCTGCT CGGCATCGTC GCCTTCGAGG AGCGCCGCTT CGCCGATGCC 
GCCGGTTACT GGGAGCGCCT GGTGGAAATC CTGCCCGAGG GCGATCCGTC GCGGGCGGCC 
ATCGCCGGCG GCATCGCCCG GGCGCGCGAG CAGGCCGGCG CGTCGCAGGG CGCGGCGCCG 
GCCGCCGCCC AGGTGGAGCT GAAGGTCAGC GTCGCCCTGG CGCCGGAGCT GGCCGGCAAG 
GTGCGGCCGG ACGACAGCGT GTTCGTCTTC GCCCGCGCCG TTTCCGGTCC GCCGATGCCG 
CTGGCGGTCG AGCGTCTGCG CGTGGCCGAT CTGCCGGCGC AGGTCGCCCT GAGCGATGCC 
GATGCGATGA TGCCCCAGCT CAAGCTGTCC AACTTCGCCG AGGTGCAACT GGTGGCCCGG 
ATCTCGCGGG CCGGCGATCC CACTGCGGGC GACTGGGTCG GCCAGCTCGA GCGGGTGAGC 
GCCAGGGCAT CGGGCGAATA CGTCCTGACC ATCGATCGAG CCGACGCGCC CCGGGGGCGC 
CCTGGAGAGG ACCGATGA

Protein sequence

MIDFWIAAGL LLLLALAFLL LPVLRTRRAQ AEEDRTALNV ALYEERLAEL DAQRAAGTLS 
AGQLEAGRAE AARELLADTE AGEAPRRSSL GRAVPLAVAL LVPLLGYGLY LHWGASDKLE 
LARRFAEQPK SIEEMTARLE QAVKVQPDSA EGWYFLGRTY MAEERPADAV AAFEQAARLA 
QRPPEILGQW AQALYFAEGK RWSPRMQALT DEALAGEPAE VTSLGLLGIV AFEERRFADA 
AGYWERLVEI LPEGDPSRAA IAGGIARARE QAGASQGAAP AAAQVELKVS VALAPELAGK 
VRPDDSVFVF ARAVSGPPMP LAVERLRVAD LPAQVALSDA DAMMPQLKLS NFAEVQLVAR 
ISRAGDPTAG DWVGQLERVS ARASGEYVLT IDRADAPRGR PGEDR