Gene Francci3_0071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0071
Symbol
ID	3905406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	89381
End bp	90892
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	73%
IMG OID	637877401
Product	hypothetical protein
Protein accession	YP_479194
Protein GI	86738794
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCCGT ACCAACCAGC GGGGCCGGAT CCGCGGCCTA GCGGCTACGG CCCTCCGACC 
GGGCCATATG ACGCCGCGGG CCCGGTGACC GGGCCCTACC ACCCGGTACC GGCGAGCCAT 
GGCGATCCCG GCCATGGCGA TCCCGGCCAT GGCAGTCCAC GTCAGGGCAG TTCGATACAG 
CCCGAGGATA TCGATTCCCC GTCCACCGGC ACCTCGATGC GCCGGGCGCT CGTCCCGCCC 
GCTCGGACCG CTCGGACCGC TCGGGCTGAG AGCCCGCGGT CCCGAGCCGT TCCTGGTTCC 
ACTCCCACTC CCGCACCCGC ACCCGGTTCC ACTCCCGGGC GTCGACCACC CGGATGGGCT 
ACCGATGGAA GGTCGGCTCC ACGAGGTGGA CCGGATCGGC AGAATGAGGT CGGTCTGCCG 
CGGGCCAGAA GGGCGATGCC GACACGTCGG GCCGACGGTG CCTCCACAGG CGGTCCGCCG 
ACCGGCGGCG CCGGGATGAG AGACGGTGGA ACAGGCCCGC GGATGCCCTA CGGCAGGGAT 
GCCGGCGACG ACCTCGGACT CGACCGACGC CATGCCGACC GCACCGATCC TGATCGGCCC 
GGTCGGCCCG GTCGGCCCGG TCGGCCCGGT CGGCCCGGTC GGCCCGGTCG GCCCGAGGCT 
TACCCGCCGG GCGCGGGGCG GAGCCGGCCG AGTCCGGCGC GGTTCGGAGC CGATCAGCGG 
GTCGCGGCGC GTCGCTCGGG GAGCCTGGCC TCCGCCGCGG GCACAGCCGA TTTCCCCGAC 
GATGACGACG CTCGCGATTC CCGACAGGGA GATCGTGATT CCGACACCAT GCCTTTCCTG 
CATCGGGTCG GGGTGGCCCT GGTGGTGCTG GCCGTGGCAC TCGGGGTGGG CGTCGGGGCC 
GGTGCCGTCT GGGAAAAGGT CCGGCCCAGC GGCCGGACCG CCAATGCGGC CCCGGCGCCG 
ACGGCAGCAT CGTCCGGCGG CCCCGCAGCG GCCGCGCCCA GCCCAAGCAC AGGGGCGGCT 
GGCGGTCAGG CAGCTGGCGG TCAGGCGGCT GCGGGCCAGA TCGCGGTGCC GGCGGACTGG 
ACCTCGTTCA CCGACACTGT GCAGAAGGCC ACCTTCTCCC ACCCGCCCGT GTGGAAGCAG 
CGGCGCGACA ACACCGGCAT CTTCTACGGC GAGCCCGGCA CCGTCTCGGA GTACGGACCG 
CAGATGATCG GGGTGGCCCG GGTCGCGGTG CAGGATCCGG TGGCAGCGCT CACGCAGGTC 
CAGTCCGCCG AGTTCAACAC GGTCCCCGGT CTGACCAGGG ACCATTCCGG TCCGGCGACG 
GACACCAGCG ATCAGCCCAC CCAGGAACTT GCCGGCTCGT ACGACCGGGA GGGGCAGCGG 
GTCTCCTACC TCATGCGCAC GGTGTCGGTG GCCGGTGCCG TGTACGTGCT CATCGCGCGA 
GTGTCGACCA ACGTCCTGGC GTCGCTCAAC ACGCTGATGG GCGCACTGCG GTCGTCGTTC 
GCGCCGGCCT GA

Protein sequence

MEPYQPAGPD PRPSGYGPPT GPYDAAGPVT GPYHPVPASH GDPGHGDPGH GSPRQGSSIQ 
PEDIDSPSTG TSMRRALVPP ARTARTARAE SPRSRAVPGS TPTPAPAPGS TPGRRPPGWA 
TDGRSAPRGG PDRQNEVGLP RARRAMPTRR ADGASTGGPP TGGAGMRDGG TGPRMPYGRD 
AGDDLGLDRR HADRTDPDRP GRPGRPGRPG RPGRPGRPEA YPPGAGRSRP SPARFGADQR 
VAARRSGSLA SAAGTADFPD DDDARDSRQG DRDSDTMPFL HRVGVALVVL AVALGVGVGA 
GAVWEKVRPS GRTANAAPAP TAASSGGPAA AAPSPSTGAA GGQAAGGQAA AGQIAVPADW 
TSFTDTVQKA TFSHPPVWKQ RRDNTGIFYG EPGTVSEYGP QMIGVARVAV QDPVAALTQV 
QSAEFNTVPG LTRDHSGPAT DTSDQPTQEL AGSYDREGQR VSYLMRTVSV AGAVYVLIAR 
VSTNVLASLN TLMGALRSSF APA