Gene Cfla_2081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2081
Symbol
ID	9145977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2323545
End bp	2325368
Gene Length	1824 bp
Protein Length	607 aa
Translation table	11
GC content	67%
IMG OID
Product	cytochrome c oxidase, subunit I
Protein accession	YP_003637175
Protein GI	296129925
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCGC ACACCGAGGT CATCCCGGGC CTGTCGCCCC GGCGGCAGAC GCTGGGGCGG 
ACGGTCGTGA AGTGGCTCAC CTCCACCGAC CACAAGACGA TCGGGTACAT GTACCTGATC 
ACGTCGTTCG TGTGGTTCGC GATCGGCGGG ATCCTGGCGC TGCTCATCCG CGCCGAGCTG 
TTCCAGCCCG GGATGGACCT GTTCCAGTCG AAGGAGCAGT ACAACCAGGC GTTCACGATG 
CACGGCACGA TCATGCTGCT GCTCTTCGCG ACGCCGCTGT TCGCGGGCTT CGCGAACATC 
ATCATGCCGC TGCAGATCGG CGCCCCGGAC GTGGCGTTCC CGCGCCTCAA CATGTTCGCG 
TACTGGCTGT ACCTGTTCGG CGGGCTCATC GCGGCCGCCG GCTTCCTCAC GCCGCAGGGT 
GCCGCGTCGT TCGGCTGGTT CGCCTACGCG CCGCTGTCCA ACCAGCTCTA CTCACCGGGT 
CTGGGGGGAG ACCTGTGGGT CTTCGGCCTC GCGCTGGGCG GCTTCGGCAC CATCCTCGGG 
GCCGTCAACT TCATCACCAC CGTGGTCACG ATGCGTGCGC CCGGCATGAC GATGTTCCGC 
ATGCCGATCT TCACCTGGAA CATCCTGGTG ACGTCGCTGC TCGTGCTCAT GGCGTTCCCG 
CCGCTGGCTG CGGCGCTGTT CGCGCTCGGC GCCGACCGCC GCCTGGGTGC GCAGGTGTTC 
AACCCCGACA ACGGCGGGGC GCTGCTGTGG CAGCACCTGT TCTGGTTCTT CGGGCACCCG 
GAGGTCTACA TCATCGCGCT GCCGTTCTTC GGCATCGTGT CGGAGATCCT GCCGGTCTTC 
TCCCGCAAGC CGATCTTCGG CTACAAGGGC CTGGTCTACG CGACGATCGC GATCGCAGCC 
CTGTCCGTCA CCGTCTGGGC GCACCACATG TACGCGACCG GCGCGGTCCT GCTGCCCTTC 
TTCGCCTTCA TGACGATGCT CATCGCCGTG CCGACCGGTG TGAAGTTCTT CAACTGGATC 
GGCACGATGT GGCGCGGGAA GCTGACGTTC GAGACGCCCA TGCTGTGGAG CATCGGGTTC 
CTCGTGACGT TCCTCTTCGG CGGCCTGACG GGCGTCATCC TGTCGAGTCC GGCACTCGAC 
TTCCACCTGT CCGACACGTA CTTCGTCGTC GCGCACTTCC ACTACGTCGT CTTCGGGACC 
GTGGTGTTCG CGATGTTCGC CGGCTTCTAC TTCTGGTGGC CGAAGTTCAC CGGGCGCATG 
CTCGACGAGC GACTCGGCAA GCTGCACTTC TGGCTCCTGT TCGTGGGCTT CCACATGACG 
TTCCTCGTCC AGCACTGGCT GGGTGTCATC GGCATGCCGC GCCGGTACGC CGACTACTCG 
CCGGCGGACG GGTTCACGTG GATGAACCAG CTCTCGACGG TCGGGTCGAT GATCCTCGCG 
GCGTCGACGC TGCCGTTCCT CTGGAACGTC TACGTCACCT GGCGCAACGC CCCGAAGGTG 
ACGGTCGACG ACCCGTGGGG CTACGGCGCC TCCCTGGAGT GGGCCACGAG CTGCCCGCCG 
CCGCGGCACA ACTTCGTCTC GCTGCCCCGG ATCCGTTCCG AGCGTCCGGC GTTCGACCTG 
CACCACCCGG AGGTCGCCGC GATGGACCAC GTGGCACCGG AGGACCCCGG GCCGCTGGAC 
TGGGCGCCGC AGCAGACCGG TGAGCGGGAG CTGGCCGAGG AGCGGATCGC CCGTGGTTCC 
GGCGAGCAGG ACCAGTCGTC GGCGACGGTC GTCGAGTCGG ACATCGAGGA CGTGCGCGAG 
CGGCGCGAGG AGGAGGAGCG GTGA

Protein sequence

MAAHTEVIPG LSPRRQTLGR TVVKWLTSTD HKTIGYMYLI TSFVWFAIGG ILALLIRAEL 
FQPGMDLFQS KEQYNQAFTM HGTIMLLLFA TPLFAGFANI IMPLQIGAPD VAFPRLNMFA 
YWLYLFGGLI AAAGFLTPQG AASFGWFAYA PLSNQLYSPG LGGDLWVFGL ALGGFGTILG 
AVNFITTVVT MRAPGMTMFR MPIFTWNILV TSLLVLMAFP PLAAALFALG ADRRLGAQVF 
NPDNGGALLW QHLFWFFGHP EVYIIALPFF GIVSEILPVF SRKPIFGYKG LVYATIAIAA 
LSVTVWAHHM YATGAVLLPF FAFMTMLIAV PTGVKFFNWI GTMWRGKLTF ETPMLWSIGF 
LVTFLFGGLT GVILSSPALD FHLSDTYFVV AHFHYVVFGT VVFAMFAGFY FWWPKFTGRM 
LDERLGKLHF WLLFVGFHMT FLVQHWLGVI GMPRRYADYS PADGFTWMNQ LSTVGSMILA 
ASTLPFLWNV YVTWRNAPKV TVDDPWGYGA SLEWATSCPP PRHNFVSLPR IRSERPAFDL 
HHPEVAAMDH VAPEDPGPLD WAPQQTGERE LAEERIARGS GEQDQSSATV VESDIEDVRE 
RREEEER