Gene Francci3_0461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0461
Symbol
ID	3903192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	539161
End bp	540600
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	72%
IMG OID	637877792
Product	hypothetical protein
Protein accession	YP_479576
Protein GI	86739176
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.592182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.120209
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTGCAC GTGCCGTCCG GTCCGTCCAC ATCCCACGCG CCACCGCCAA CGGCCCAGGC 
GGCACCGCCA ACGACTCGGA TCGACCCCCA CGGCCCACGC GCCGCACCCG GTCGACGGCG 
AATCGTGGTG ACCGATCCGT GGCGGCTGTC CCCTCAACGG CCAACGCCTG CAAGAATGAC 
AGGAAACGTC AGTCGATCTT CGGGAACACC ATGAGCGACC GCAGCGAGCC CGACCACGCC 
TCCGCCTGGG GGCGTGTCGC CGATGACGGC ACGGTCTTCG TTCGCACGGC CAGCGGCGAA 
CGTGCCGTCG GATCATGGCG TGCCGGCAGT CTCCGTGAGG GTCTGGCCCA CTTCGAGCGC 
CGCTTCGACG ATCTGTCCGC CGAGGTCGAG CTGCTCGAGC GGCGGCTGAC GGTCAGCGGG 
GTCGATCCGG CCGGGATCGT CGGCAGCGCA CGGCGGCTGC TCGATTCCCT CGACGAGGCC 
GCGGTCGTCG GTGATCTGGA TGCGCTGCGC ACGCGGCTGG AGGCCGTGGT CGCCGCCACT 
GAGGAACATC GCTCCGCGCT CGCTGCCGAG CGGGCCGAGC GGGCCGGCCG GATCGCCGCG 
GCCAAGGAGC AGCTGGTCGC CGAGGCCGAA CGGCTCGGCC GCAGCTCGGA GTGGAAGACC 
GCCGGGGAGC GGTTCCGCGC GCTCGCCGAG GAGTTCCGCG CCGCCGGCTC GTTGGACAAG 
CGCACCGACT CGGCGCTGTG GCGGCGCATC GCCACGGCCC GGGACGAGTT CACCCGCCGC 
CGGACCGCGC ACTTCGCCGC CCTCGACACG CAGCGGGCCC GTTCGAGGGA ACGGAAGGAG 
GCGATCATCG CCGAGGCGGA GGCGCTGTCC GACTCCACCG ACTGGGCCGG CACGGCCGCC 
CGCTACCGGG CGTTGCTCGC CGACTGGAAG GCCGCCGGTC GCGCGGCAAA GGATATCGAC 
GACGCGTTGT GGAACCGCTT CCGTGCGGCG CAGGACGCCT TCTTCACCCG CCGCAACGAG 
GCCAATGCCG AGCGCGACGC CGAGTTGCGC GAAAACCAGG TCAAGAAGGA GAAACTGCTG 
GCCGAGGCGA CGGCGTTGGA TCCGGCCGAT ACCGACCGCT CGCTGCGTCG TCTCCGGGAG 
ATCCAGGACC GCTGGGACGA GATCGGACGG GTCCCCCGGG AGGTCGCGGG CTCCCTGGAG 
CGGCAGATGG CGGCCATCGG CGACAAGCTG CGCGAGGCCT CCGACGCCCG CTGGGCCCAG 
CGCTCCCTCG CTTCCTCACC ATTCGTGACG AAGCTGCGGG AATCCGTCGC GAAATTGGAG 
GCGAAGCTGG CCCGGGCCCA GGCCGCCGGA CGCACCAAGG AGATCGCCGA CACCGAGTCC 
GCCCTCGCCG CCCAGCGGGC CTGGCTGGCC CAAGCCGAGG GACAGTCCCA CAACGACTGA

Protein sequence

MPARAVRSVH IPRATANGPG GTANDSDRPP RPTRRTRSTA NRGDRSVAAV PSTANACKND 
RKRQSIFGNT MSDRSEPDHA SAWGRVADDG TVFVRTASGE RAVGSWRAGS LREGLAHFER 
RFDDLSAEVE LLERRLTVSG VDPAGIVGSA RRLLDSLDEA AVVGDLDALR TRLEAVVAAT 
EEHRSALAAE RAERAGRIAA AKEQLVAEAE RLGRSSEWKT AGERFRALAE EFRAAGSLDK 
RTDSALWRRI ATARDEFTRR RTAHFAALDT QRARSRERKE AIIAEAEALS DSTDWAGTAA 
RYRALLADWK AAGRAAKDID DALWNRFRAA QDAFFTRRNE ANAERDAELR ENQVKKEKLL 
AEATALDPAD TDRSLRRLRE IQDRWDEIGR VPREVAGSLE RQMAAIGDKL REASDARWAQ 
RSLASSPFVT KLRESVAKLE AKLARAQAAG RTKEIADTES ALAAQRAWLA QAEGQSHND