Gene Franean1_0895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0895
Symbol
ID	5669309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1044613
End bp	1046298
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	65%
IMG OID	641239822
Product	cytochrome c oxidase subunit I type
Protein accession	YP_001505257
Protein GI	158312749
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.822333
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.123512
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTATTC TGCGCGAGCC GTCCGGCCAC GCCGTCGAAC ACGCGGAAGC CGGACACTCC 
CGGCCACGCA CGAACATGCT AGGATATCTT CGCACCACCT CGCACAAGGA TATCGCCGTC 
CTGTACGCGG TGACGTCGTT CGGGTTCTTC ATCCTCGCCG GGATCCTGGC CATGATGATG 
CGTGCCGAGC TGGCACGGCC GGGTCTGCAG TACTTCTCGA ACGAGCAGTA CAACCAGTTT 
TTCACCCTGC ACGGCACGCT CATGCTGCTG CTGTTCGCGA CGCCGCTGGC GTTCGCCTTC 
GCGAACTTCC TCATACCGCT GCAGATCGGG TCGCCGGACG TCGCGTTCCC CCGGCTCAAC 
GCCCTTTCGT ACTGGTTCTT CCTGTTCGGC GGGCTGATGG TCGTCGCCGG CTTCCTCACC 
CCGGACGGCG CCGCGGACTT CGGCTGGTTC GCCTACGCCC CACTGAACAA CAAGACGTTC 
AGCCCGTCGG TCGGGGCGGA CATGTGGATC CTGGGCCTCG TCGTCTCCGG GCTCGGGACG 
ATCCTCGGCG CGGTCAACAT GATCACCACG ATACTCACCC TGCGCGGCCC CGGTATGACG 
ATGTTCCGCC TGCCGATCTT CTGCTGGACG TTCCTCGTGA CGTCCGTGCT GGTGATCGTC 
GCGTTCCCGG TGCTGGCTGG GGCCCTGCTG TCGCTGGAGG CCGACCGGCG CTTCGGCGCC 
CACGTGTTCG ACTCGGAGAA CGGCGGCGCC ATCCTCTGGC AGCACCTGTT CTGGTTCTTC 
GGGCATCCCG AGGTCTACAT CATCGCCCTG CCGTTCTTCG GCATCATCAG CGAGATCATC 
CCGGTCTTCT CCCGGAAGCC GGTCTTCGGC TACAAGGGCC TGGTGTTCGC CACCATCGCC 
ATCGGCGCCC TGTCGATCGT GGTCTGGGCA CACCACATGT TCGTCACCGG CGCGGTACTG 
CTGCCCTTCT TCGCCGTGAT GTCGTTCCTG ATCGCCGTCC CGACCGGTAT CAAGTTCTTC 
AACTGGATCG GGACGATGTG GCGGGGCAAG CTGAGCTTCG AGACCCCGAT GATGTTCTGC 
CTCGGGTTCC TCGTGACGTT CCTCCTCGGC GGGCTGACCG GGGTGATGCT CGCGAGCCCG 
CCGATCGACT TCCACGTCAG CGACAGCTAC TTCGTGGTCG CCCACTTCCA CTACGTGGTG 
TTCGGGACGG TCGTCTTCGC GGCGTTCGCC GGCACGTACT TCTGGTTCCC CAAGCTGACC 
GGCCGGATGA TGGACGACCG GCTCGGCAAG ATCCACTTCT GGACCGTCTT CCTGGGCTTC 
CACCTGACGT TCCTGGTGCA GCACTACCTG GGCATGCAGG GGATGCCCAG GCGGTACGCC 
GACTACGGGC CGGGCGACGG ATTCACCACG TTGAACACGA TATCGACCGC TGGCAGCTTC 
CTGCTCGGGG TCTCGACACT GCCGTTCATG TACAACGTGT GGAATTCCTA CCGCCGCGGC 
CGGCTCGCCG TCGTCGACGA CCCGTGGGGG TACGGGAACT CCCTCGAGTG GGCGACGTCC 
TCCCCGCCGC CCCGGCACAA CTTCCACCAG CTGCCGCGCA TCCGCTCCGA GCGCCCCGCC 
TTCGACCTGC ACTACCCGGA GGTCGCCGGC GTCACCGACT ACCACGCCAC CCCCGAACTG 
CGCTAG

Protein sequence

MTILREPSGH AVEHAEAGHS RPRTNMLGYL RTTSHKDIAV LYAVTSFGFF ILAGILAMMM 
RAELARPGLQ YFSNEQYNQF FTLHGTLMLL LFATPLAFAF ANFLIPLQIG SPDVAFPRLN 
ALSYWFFLFG GLMVVAGFLT PDGAADFGWF AYAPLNNKTF SPSVGADMWI LGLVVSGLGT 
ILGAVNMITT ILTLRGPGMT MFRLPIFCWT FLVTSVLVIV AFPVLAGALL SLEADRRFGA 
HVFDSENGGA ILWQHLFWFF GHPEVYIIAL PFFGIISEII PVFSRKPVFG YKGLVFATIA 
IGALSIVVWA HHMFVTGAVL LPFFAVMSFL IAVPTGIKFF NWIGTMWRGK LSFETPMMFC 
LGFLVTFLLG GLTGVMLASP PIDFHVSDSY FVVAHFHYVV FGTVVFAAFA GTYFWFPKLT 
GRMMDDRLGK IHFWTVFLGF HLTFLVQHYL GMQGMPRRYA DYGPGDGFTT LNTISTAGSF 
LLGVSTLPFM YNVWNSYRRG RLAVVDDPWG YGNSLEWATS SPPPRHNFHQ LPRIRSERPA 
FDLHYPEVAG VTDYHATPEL R