Gene Francci3_4239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4239
Symbol
ID	3907205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	5057602
End bp	5058603
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	69%
IMG OID	637881565
Product	periplasmic binding protein
Protein accession	YP_483314
Protein GI	86742914
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.364549
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAC TCGGCGCCGG CGTCGCGGTC GCTGCCCTGC TCGTTGTTAC CGCCGGTCTC 
ACCGGCTGCG GGTCCGGTTC GACCACCGGC GCGGGCAGTG CGAGCGCGGC CGATGCCCGG 
TCGGCCCCGG CCGGTACCCG CTATCCCGTT GAGGTGGCGA ACTGCGGCCG GACCCTGCAC 
TTCGACGAGG CCCCGGCGCG GGTCGTCTCC GGGTGGACCA CCAGTACCGA GCTCCTCATC 
GAACTGGGCC TGACGGACCG GATTGTTGGC CAGTACAACA CCAGCAGCGG CACACCGGCG 
GCGAAGTACG CCAGTGTGGA GGCGAAGCTA CCCGCCCTCG GTACCGGCGC ACCGACCCGG 
GAGGCGCTGC TCGCCGCCCG GCCCGACCTG ATCTGGGCGG ATGGCAGCTA TCTGTTTGAC 
GGCCGGCAGC TCCCCACGAT CGCCGAGCTG GCCGCCCAGG GCACCCAGGT GATGATTCTC 
AGCGGGTTCT GCACCGACGA CGCCACCAAG GCGACGGTCC GTGACGTCGA TACCGACCTG 
ACCGCGCTCG GCATGATCTT CGGCATTCCG GGCCGGGCCA GGCAGGTCCA GGCCGACATC 
AACGAACGGC TCCGCCAGGT CGCGACGAAG ATCCAGGGCA GGGACCCCGT CCCGGTCGCG 
GTGGTCGCCA CCTACCAGGG AACCGTCTAC ACCTACGACG GCGTCTACAC CGACATCGCG 
CGGCTCGCCG GGGCGCGGAA CATCTACGCG GGCACCCTGC CCAAGGGCAA ATACTTCAGT 
GAGCTGTCGG TGGAGGACCT CATCAGCAAG AATCCCGGCA CCCTCGTCTA TCTGCTCAGC 
GGCAGCGAAA CCGAGGCCGA GGCCCGCAAG TTCCTCACCT CCCGGCTCCC GACCGTGGCG 
GCAGTCCGCA ACAACCGTGT GTTCTTCCTC CCGCAGTCGG ACTCGGCCAA CCTCGCCGGC 
GTGGAAGGCG TGACAAAGCT GGCCGCCGCG CTGCACGCCT GA

Protein sequence

MKKLGAGVAV AALLVVTAGL TGCGSGSTTG AGSASAADAR SAPAGTRYPV EVANCGRTLH 
FDEAPARVVS GWTTSTELLI ELGLTDRIVG QYNTSSGTPA AKYASVEAKL PALGTGAPTR 
EALLAARPDL IWADGSYLFD GRQLPTIAEL AAQGTQVMIL SGFCTDDATK ATVRDVDTDL 
TALGMIFGIP GRARQVQADI NERLRQVATK IQGRDPVPVA VVATYQGTVY TYDGVYTDIA 
RLAGARNIYA GTLPKGKYFS ELSVEDLISK NPGTLVYLLS GSETEAEARK FLTSRLPTVA 
AVRNNRVFFL PQSDSANLAG VEGVTKLAAA LHA