Gene Cfla_2078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2078
Symbol
ID	9145974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	2320448
End bp	2322199
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	68%
IMG OID
Product	Cytochrome b/b6 domain protein
Protein accession	YP_003637172
Protein GI	296129922
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA CCACCGCACC GGCCGGCGGC AGCAAGGCCG CCGCCGCGAC CGCCGACTAC 
CTCGACCAGC GCACCGGCAT CGGGACCGCG GTCAAGGAGT TCGCGCGCAA GATCTTCCCC 
GACCACTGGT CGTTCCTGCT GGGCGAGATC GCGCTCTACA GCTTCGTCAC GCTGATCATC 
TCCGGCGTGT TCCTCACCAT GTTCTTCGTC CCGAGCATGA ACGAGGTGCA CTACGAGGGC 
CCGTGGCCGG CGCTGGACGG CGTCGAGATG TCCGAGGCGT TCGCCTCGAC GCTGCGTCTG 
TCGTTCGAGG TCACCGGCGG TCTGCTCATG CGGCAGATCC ACCACTGGGC GGCCCTGATC 
TTCATGGCCG CGATCGTCAC GCACATGATG CGCGTCTTCT TCACCGGCGC GTTCCGCAAG 
CCGCGCGAGC TCAACTGGGT CGTCGGCTTC GTGCTCCTGA TCCTGGGCCT CGGCGCCGGC 
TTCACGGGCT ACTCGCTCCC CGACGACGTC CTGTCCGGCA ACGGCCTGCG CATCACCGAC 
GGCGTCGTCC GCTCGATCCC GATCCTCGGC AGCTACCTCT CGTACTTCAT CTTCGGCGGC 
GAGTTCCCGG GGCACGACGT CATCCCGCGC CTGTTCACGC TGCACATCCT GGTCGTTCCC 
GGCCTGATCC TGGCGCTCGT GGGTCTGCAC CTGTTCTTCG TCGTGCTGCA CAAGCACACG 
CAGTACCCGG GCTCGGGCCG CACCAACGCG AACGTCGTGG GCTTCCCGCT CTTCCCGATC 
TACGTCGCGA AGGCCGGTGG CTACTTCTTC GTGGTGTTCG GCGTCATCGC CCTGCTGGGC 
GCGACGATGT CGATCAACCC GGTGTGGAAC TACGGGCCCT ACGACCCGTC CCCGGTCTCG 
GCGGGCGCCC AGCCGGACTG GTACATGCTG TTCCTCGAGG GCTCGCTGCG CCTCATGCCG 
GGACAGACGG AGTACGTGCT GTTCGGACCT GATGGCTGGA CGCTGTCGCT GAACGTCCTC 
ATCCCGGCGG TCGTGGTGCC CGGCGTGCTG TTCACGCTGC TGGCGCTCTA CCCCTTCGTC 
GAGGCGTTCG CGACCGGGGA CAAGCGCGAG CACCACCTGC TCGACCGCCC GCGCAACCGG 
CCGTTCCGGA CCGCGTTCGG CGTCTCGCTC CTCACCGCCT TCTTCATCCT CGTGCTGGCG 
GGGTCGAACG ACCTCATCGC GACGCACTTC GCCCTGTCGA TCAACGACAT CACCTGGGTC 
TTCCGGGTGC TGCTCTTCGT GGGGCCGTGG GCGATGTTCG TCATCACCAA GCGCATCTGC 
CTCGGTCTGC AGCGCAAGGA CCGCGAGCTC GTCCTGCACG GCCACGAGAC GGGCCAGATC 
GTTCGGTTCG CGTCGGGCGA GTACATCGAG GTGCACAAGC CGCTGGACGC CCACGAGCGC 
TGGCTGCGCG TGCAGCACGA CGCGATCCGC CCCATCGAGA TCGAACCGGC GGAGGACTCC 
CGCGGTGTGC GACGCAAGGG CTACCGCCTC GACCGTCTGC GTCAGCGTCT GTCGCAGACG 
TTCTACGAGG ACCGTGTCGA GCCGGTGACG CCGGCCGAGC TCGAGGCCTC GCACTCGCAC 
GGCGAGCACG ACGCACTGGG CTCCGACCAG GAGAAGCCGC CCGCGCAGCT GCTCGCCGAG 
GGCGCTCCCA CGGGCGGCGG CACGCGCCTT CGCCCGCAGG ATGAGACGGA CACCGACGCG 
CGGAACAGGT GA

Protein sequence

MSTTTAPAGG SKAAAATADY LDQRTGIGTA VKEFARKIFP DHWSFLLGEI ALYSFVTLII 
SGVFLTMFFV PSMNEVHYEG PWPALDGVEM SEAFASTLRL SFEVTGGLLM RQIHHWAALI 
FMAAIVTHMM RVFFTGAFRK PRELNWVVGF VLLILGLGAG FTGYSLPDDV LSGNGLRITD 
GVVRSIPILG SYLSYFIFGG EFPGHDVIPR LFTLHILVVP GLILALVGLH LFFVVLHKHT 
QYPGSGRTNA NVVGFPLFPI YVAKAGGYFF VVFGVIALLG ATMSINPVWN YGPYDPSPVS 
AGAQPDWYML FLEGSLRLMP GQTEYVLFGP DGWTLSLNVL IPAVVVPGVL FTLLALYPFV 
EAFATGDKRE HHLLDRPRNR PFRTAFGVSL LTAFFILVLA GSNDLIATHF ALSINDITWV 
FRVLLFVGPW AMFVITKRIC LGLQRKDREL VLHGHETGQI VRFASGEYIE VHKPLDAHER 
WLRVQHDAIR PIEIEPAEDS RGVRRKGYRL DRLRQRLSQT FYEDRVEPVT PAELEASHSH 
GEHDALGSDQ EKPPAQLLAE GAPTGGGTRL RPQDETDTDA RNR