Gene Francci3_2009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2009
Symbol
ID	3906725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2360244
End bp	2361959
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	65%
IMG OID	637879345
Product	cytochrome-c oxidase
Protein accession	YP_481112
Protein GI	86740712
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACTTG TGCACGATAG GCCGGCCGGG CACACGGACC CGCCGGCGGG CGAGCTCCCG 
CCCAGGGTTG TGAAAACCCT GGCGCAGTAC CTGCGGACGA CGTCGCACAA GGACATCGCG 
CTGCTGTACT TCATGACCTC GCTGGTATTC TTCGCGTTCG CTGGAATCCT GGCGATGCTC 
ATCCGGGCCG AGCTCGCCCG ACCGGGCCTG CAGTACCTGT CGAACGAGCA GTACAATCAG 
GTGTTCACGA TGCACGGCAC GCTGATGCTG CTGATGTTCG CGACGCCGAT CGCGTTCGCG 
TTCGCGAACT ACCTGATCCC GCTGCAGATC GGCTCGCCTG ACGTGGCCTT TCCACGGCTG 
AACGCGTTGT CGTTCTGGCT GTTCCTGTTC GGCAGCCTGA CGGTCACCGC GGGCTTCCTT 
ACGCCGAACG GCGCCGCCTC CTTCGGCTGG TTCGCCTATA CGCCGCTGTC GAACGCTGCC 
TACTCGCCGG GCATCGGCAG TGACCTGTGG GTGCTGGGTC TGACCGTCTC CGGTCTGGGT 
ACCATCCTGG GCGCGGTCAA CTTCATCACG ACGATCCTTT GCCTGCGGGC GCCCGGCATG 
ACGATGTTCC GGCTGCCGAT CTTCTGCTGG AACCTGCTGG TGACCTCGAT CCTGGTTCTG 
GTCGCCTTCC CGGTGCTCGC GGCCGCGCTG CTCGCCCTGG AGTTCGACCG CCGGTTCGGC 
GCGCACATCT TCGACCCGGG TAACGGCGGC GCAGTCCTCT GGCAACACCT GTTCTGGTTC 
TTCGGGCATC CCGAGGTGTA CATCATCGCC CTGCCCTTCT TCGGGATGAT AACGGAGATC 
ATCCCGGTGT TCTCCCGCAA GCCGTTGTTC GGCTACAAGG GACTGGTCTA CGCGACCATC 
GGCATCGGGG CGTTGGCGAT CGCCGTGTGG GCGCATCACA TGTACGTCAC CGGCGCGGCG 
CTGCTGCCGT TCTTCGCTTT CCTGACGTTC CTGATCGCGG TGCCAACCGG GGTCAAGTTC 
TTCAACTGGA TTGGCACGAT GTGGCGCGGA CAGCTCACCT TCGAGGCGCC GATGTTGTTC 
GCCGTCGGCT TCCTGGTGAC GTTCCTGTTC GGTGGTCTGA CCGGTGTCCT GCTGGCCAGC 
CCGCCGATCG ACTTCCACGT CTCGGACAGC TACTTCGTCG TCGGCCACTT CCACTACGTC 
GTCGCCGGCC TGTTGTTCGC CGGCTTCGGC GGGGTGTACT TCTGGTTCCC GAAGGTCACC 
GGCCGGATGT TGAACGAGCG GCTCGCGAAG GTGCACTTCT GGACGATGTT CTTCGGCTTC 
CACCTGACCT TCCTGGTGGA TCACTGGCTC GGCGTCAAGG GCATGCCGCG CCGATACGCC 
GACTACGGCC CGGACGACGG CTTCACCACG CTGAACACCA TCGCCACCGC TGGCAGCTCC 
CTGCTTGCGC TGTCGACCCT GCCGCTGCTG TACAACCTGT GGTGGTCGTA CCGGAAGGGT 
CGGATCGTGA CGGTGGACGA CCCGTGGGGC TTCGGCAACT CGCTGGAATG GGCGACGTCC 
TGCCCACCGC CGCGGCACAA CTTCACCTCG CTACCGCGGA TCTGCTCCGA GCGGCCCGCC 
TTCGACCTGC ACTACCCGCA GGCGGCCGGC GCGGTCGACT ACCACGCCAC CCCCGAGCTC 
ACCCCGACCC ACGACACCCC GGAGCTGAAT ACCTGA

Protein sequence

MTLVHDRPAG HTDPPAGELP PRVVKTLAQY LRTTSHKDIA LLYFMTSLVF FAFAGILAML 
IRAELARPGL QYLSNEQYNQ VFTMHGTLML LMFATPIAFA FANYLIPLQI GSPDVAFPRL 
NALSFWLFLF GSLTVTAGFL TPNGAASFGW FAYTPLSNAA YSPGIGSDLW VLGLTVSGLG 
TILGAVNFIT TILCLRAPGM TMFRLPIFCW NLLVTSILVL VAFPVLAAAL LALEFDRRFG 
AHIFDPGNGG AVLWQHLFWF FGHPEVYIIA LPFFGMITEI IPVFSRKPLF GYKGLVYATI 
GIGALAIAVW AHHMYVTGAA LLPFFAFLTF LIAVPTGVKF FNWIGTMWRG QLTFEAPMLF 
AVGFLVTFLF GGLTGVLLAS PPIDFHVSDS YFVVGHFHYV VAGLLFAGFG GVYFWFPKVT 
GRMLNERLAK VHFWTMFFGF HLTFLVDHWL GVKGMPRRYA DYGPDDGFTT LNTIATAGSS 
LLALSTLPLL YNLWWSYRKG RIVTVDDPWG FGNSLEWATS CPPPRHNFTS LPRICSERPA 
FDLHYPQAAG AVDYHATPEL TPTHDTPELN T