Gene Arth_2216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2216
Symbol
ID	4445277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2491711
End bp	2493438
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	61%
IMG OID	639690025
Product	cytochrome-c oxidase
Protein accession	YP_831696
Protein GI	116670763
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00587232
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTACGT ACACTCAATC CGCACCTGCC GGGGCCCTTG GGGCGCCCGT TGTTCCGAAG 
TCCAAGGGAC GCATCGTCGT CAACTGGATC ACTTCGACCG ACCACAAGAC CATCGGGTAC 
ATGTACCTGA TCTCGTCCTT CGTGTTCTTC TGCTTCGGCG GCGTCATGGC GCTGCTGATC 
CGCGCCGAAC TTTTCGAGCC CGGAATGCAG ATCCTGCAGA CCAAAGAGCA GTACAACCAG 
CTGTTCACCA TGCACGGAAC CGTCATGCTG CTGATGTTTG CGACCCCGCT GTTCGCCGGC 
TTCGCCAACG TCATCATGCC CCTGCAGATC GGTGCACCCG ACGTCGCCTT CCCGCGACTG 
AACGCACTGG CTTTCTGGTT CTTCCTCTTC GGCTCCACGA TCGCCGTCTC CGGCTTCATT 
ACGCCCCAGG GTGCCGCTTC GTTTGGCTGG TTCGCGTACG CGCCGCTGTC CAACACCACA 
TTCAGCCCCG GCGTCGGCGG TGACCTCTGG GTGTTCGGCC TCGCACTCTC CGGCTTCGGC 
ACCATCCTCG GTGCAGTCAA CTTCATCACC ACCATCATCT GCATGCGCGC TCCGGGCATG 
ACCATGTGGC GCATGCCGAT CTTTACCTGG AACACGCTGG TTACGGCCAT CCTGGTCCTC 
ATGGCCTTCC CGCCTCTCGC TGCAGCCCTG TTCGCCCTCG GCGCGGACCG CCGCTTCGGA 
GCACACATCT TCGATCCCGA GAACGGCGGT GCAGTCCTCT GGCAGCACCT GTTCTGGTTC 
TTTGGCCACC CCGAGGTGTA CATCATCGCG CTGCCGTTCT TCGGCATCGT CTCCGAGATC 
TTCCCGGTCT TCAGCCGCAA GCCGATCTTC GGCTACAAGG GCCTCGTGTA CGCAACCATC 
GCCATCGCTG CTCTGTCCGT GACCGTGTGG GCTCACCACA TGTACGTCAC CGGCTCGGTC 
CTCCTGCCGT TCTTCTCCTT CATGACGATG CTGATCGCCG TACCTACCGG CGTGAAGTTC 
TTCAACTGGA TCGGCACCAT GTGGCGGGGT TCCATCACCT TCGAAACGCC CATGCTCTGG 
AGCATCGGCT TCCTGGCAAC CTTCCTGTTC GGTGGTTTGA CGGGCATCAT CCTGGCTTCA 
CCGCCCCTTG ACTTCCACGT ATCGGATTCC TACTTCGTGG TGGCCCACTT CCACTACGTG 
GTGTTTGGCA CCGTGGTATT CGCAATGTTC GCCGGCTTCT ACTTCTGGTG GCCGAAGTGG 
ACCGGCAAGA TGCTCAACGA GCGCCTGGGC AAGATCCACT TCTGGCTCCT GTTCCTTGGT 
TTCCACGGAA CCTTCCTGAT TCAGCACTGG CTGGGTGTCG AGGGCATGCC CCGCCGCTAC 
GCGGACTACA TGCCGCAGGA CAACTTCACG TGGATGAACC AGTTCTCCAC AATCTCCTCG 
TTCGTGCTGG GCGCTTCGCT GATCCCGTTC TTCTGGAACG TGTACATCAC CTGGCGCAGC 
AACGAAAAGG TTGAAGTGGA CGATCCCTGG GGCTTCGGTG CTTCTCTCGA GTGGGCAACC 
TCTTGCCCGC CGCCGCGCCA CAACTTCACG TCGCTGCCCC GGATCCGCTC GGAGCGTCCT 
GCCCTGGACC TCCACCACCC GGAGCTCGCA CAGTCGCACA CCGTTGAATC ACCGGCACCG 
GCAGCGTCCG TGCTGGGCAA CGCAGATCAG AAGGACACCG CCAAGTGA

Protein sequence

MATYTQSAPA GALGAPVVPK SKGRIVVNWI TSTDHKTIGY MYLISSFVFF CFGGVMALLI 
RAELFEPGMQ ILQTKEQYNQ LFTMHGTVML LMFATPLFAG FANVIMPLQI GAPDVAFPRL 
NALAFWFFLF GSTIAVSGFI TPQGAASFGW FAYAPLSNTT FSPGVGGDLW VFGLALSGFG 
TILGAVNFIT TIICMRAPGM TMWRMPIFTW NTLVTAILVL MAFPPLAAAL FALGADRRFG 
AHIFDPENGG AVLWQHLFWF FGHPEVYIIA LPFFGIVSEI FPVFSRKPIF GYKGLVYATI 
AIAALSVTVW AHHMYVTGSV LLPFFSFMTM LIAVPTGVKF FNWIGTMWRG SITFETPMLW 
SIGFLATFLF GGLTGIILAS PPLDFHVSDS YFVVAHFHYV VFGTVVFAMF AGFYFWWPKW 
TGKMLNERLG KIHFWLLFLG FHGTFLIQHW LGVEGMPRRY ADYMPQDNFT WMNQFSTISS 
FVLGASLIPF FWNVYITWRS NEKVEVDDPW GFGASLEWAT SCPPPRHNFT SLPRIRSERP 
ALDLHHPELA QSHTVESPAP AASVLGNADQ KDTAK