Gene Francci3_0211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0211
Symbol
ID	3905378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	249173
End bp	250768
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	67%
IMG OID	637877540
Product	methane/phenol/toluene hydroxylase
Protein accession	YP_479329
Protein GI	86738929
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.163709
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGCGCG GGAGCGTCGC CGGACCGGGC GGGTTCGGTC CGCGTCCGTG GGGGAACACC 
AAGGAGGCGA GCATGCCGAA GCTTGCCCGC AGTGACTGGT ACGACCTTGC CCGCGACACC 
AACTGGTCGT TTGGCTATGT GTCCGAGCAG GACGTCTTCC CAGAGGAGCT GTCGGGGACG 
GGCCGGGTCC CAGCCGAGGG GTGGCTGGCC TGGGACGAGC CATACAAGAT CACTTATCGG 
GAGTACGTGC ACAACCAGGT GACGAAGGAC ACCACGACGT ACTCGGTCAA GAACGCGATC 
GCCCGCTCGG CGCTGTTCGA GAAGCTCGAC CCGGGATGGA AGTCGGTGAT CCTGGCGCAC 
TACGGCGCGA TCACGATGCC GGAGTACCTC GCCTCCATCG GTGAGGCGCG GATGGGCCGG 
TTCGGGCGGG CGGCGGCGTG GCGCAATACG GCGACGTTCG GCACGCTCGA CGAGGTCCGG 
CACGGCCAGA TCCAGGCGTT CTTCCCCTAT GGGTTGATCG GGAAGGAGCC GCGGGCCGAC 
TGGGCGCTCA AGGCGTTCCA CACGAACGAC TGGATCGTGC TCGCGGTCCG GCAGCTGTTC 
GACGACATGT TCGTCGCCAA CGACGCGCTG TCGATCGCGC TGCAGCTCAC CTTCACCCTT 
GAGACCGGTT TCACGAACCT GCAGTTCCTC GGCATGGCGG CCGACGCGAT CAAGGTGGGC 
GACCTGGAGT TCGGATCGCT GATCTCCAGT ATCCAGACGG ACGAGGCCCG CCATGCCCAG 
CAGGGCGAGC CGACCATCAA GATCCTTGCC GAGGGCGGCC ACAAGGACTG GGGCCAGTTC 
CTCATCGATC ACATGTTCTG GCGGTCATGG CGGGTGTTCG CGCTGCTGAC CGGCCTGTCG 
ATGGACTACT ACACCCCGCT CGAGCATCGG ACGATGTCGT TCAAGGAATT CATCGAAGAG 
TGGGTGATCA AGCAGTTCTC CGACCAGTTC CGGGACTTTG GCCTGGAGTA TCCGTGGTAC 
TGGGAGGAGT TCGTCAACGA ACTCACCTGG TACCACCACG CGATTCACCT CGGGGTGTGG 
AACTGGCGGC CGACGGTCTG GTGGAACCCG GACGCCGGCG TCTCGGCGGA CGAGCGGGTG 
TGGCTGGAGG AGAAGTACCC GGGCTGGAAC CGCACGTTCG GCAAGTACTG GGATGCCATC 
GGCGACAACA TCCGCGCGGG GAAGGTCGAG GCCACCTTCC CGGAGACGCT GCCGTTGGTG 
TGCAATCTGT GCCAGCTGCC GATCGTGCGG GCCGCCGGCG TGGAGGCCGG CGCGCTGGCC 
TCGGCCGCTC CGCTGCGCCA CACCCACGGG GGCCGTGACT ACCTGTTCTG CTCGGAACCC 
TGCAAGTGGA TCTTCGCGCG GCGTCCGGAG CGGTTCGCCG GGCACCGGTC GCTGGTGGAC 
CGGTTCCTCG CCGGCGAGAT CAGCCCGCCC GACCTCGGCG GCGTGCTCGC CTACATGGGG 
CTGTCGCCGG CCGAGCAGGG ACAGGATGCC ACCGGCTACG CCTGGGCGCA GGCCGCGGCG 
GCGGGCGCAA CCGGCGCCAG GGCGGCACGG CGATGA

Protein sequence

MRRGSVAGPG GFGPRPWGNT KEASMPKLAR SDWYDLARDT NWSFGYVSEQ DVFPEELSGT 
GRVPAEGWLA WDEPYKITYR EYVHNQVTKD TTTYSVKNAI ARSALFEKLD PGWKSVILAH 
YGAITMPEYL ASIGEARMGR FGRAAAWRNT ATFGTLDEVR HGQIQAFFPY GLIGKEPRAD 
WALKAFHTND WIVLAVRQLF DDMFVANDAL SIALQLTFTL ETGFTNLQFL GMAADAIKVG 
DLEFGSLISS IQTDEARHAQ QGEPTIKILA EGGHKDWGQF LIDHMFWRSW RVFALLTGLS 
MDYYTPLEHR TMSFKEFIEE WVIKQFSDQF RDFGLEYPWY WEEFVNELTW YHHAIHLGVW 
NWRPTVWWNP DAGVSADERV WLEEKYPGWN RTFGKYWDAI GDNIRAGKVE ATFPETLPLV 
CNLCQLPIVR AAGVEAGALA SAAPLRHTHG GRDYLFCSEP CKWIFARRPE RFAGHRSLVD 
RFLAGEISPP DLGGVLAYMG LSPAEQGQDA TGYAWAQAAA AGATGARAAR R