Gene Francci3_4022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4022
Symbol
ID	3906983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4808490
End bp	4809509
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	64%
IMG OID	637881351
Product	glyceraldehyde-3-phosphate dehydrogenase
Protein accession	YP_483101
Protein GI	86742701
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAATCA TGACAATCAC TGTGGGAATC AATGGCTTCG GCCGTATCGG CCGTAGCTAC 
TTCCGTGCGC TGCTCACTTC CGGTGCCGAC ATCCGCGTGG CCGCGGTCAA CGACCTGACC 
AGCGCGCAGA GTCTGGCGGA CCTGCTGAAG TACGACAGCG TGTACGGGCC GCTGCCGCAG 
CAGGTCGCGG CGGAGGGCTC ATCGCTCAGG GTCGGGGACA CCGTGGTCGA GGTTCTCAGC 
GAACGCGACC CGGCACAGCT GCCGTGGCGC CGCCTCGGAG TCGACGTTGT CATCGAGTCG 
ACGGGCGTGT TCAACGACGC GGCCAAGGCC CGGGCGCATA TTGATGCCGG CGCCTCGAAG 
GTGGTCGTCT CTGCTGCGGC AAAGAACGCG GATCTCACCC TCGTCATCGG TATCAACGAT 
GACCTGTACG ACCCCCAGAA GCACACGGTC GTCTCCAACG CTTCGTGCAC GACGAACTGC 
CTGGCTCCCA TGGCCCGGGT GCTCGATGAC GGGCTCGGCA TCGAGTGCGG CACCATGACC 
ACGATCCACG CCTACACGCA GGATCAGAAC CTGCAGGACG GCCCGCACCC CGACCCCCGG 
CGCGCCCGTG CGGCCAACCT CAGCACCATC CCGACCACCA CCAATGCCGC CAGTGCGATC 
GGCCTCGTGC TCCCAAACCT GAAGGGCAAG CTCGACGGGT ACTCGGTGCG GGTTCCTGTT 
CCCGTTGGCT CGCTGACCGA CCTGACCGTC CGGGTGGACC GTGAGACGAC GGTGGAGGAG 
GTCAACTCGC TTTTCCGCAA GGCGGCGGAC GGTGAACTTG CACGAATCCT GCGCTACACT 
GCAGACCCGG TCGTTTCCGC GGATATCGTC AAGGATCCGG CGTCATGCAT CTTCGACTCC 
CTGCTCACGC AGGTTATCGA GGGGCGCCAC GTACACATCT TCGGCTGGTA CGACAACGAG 
TGGGGATTCT CCAACCGCCT TATAGACACA ACCCAGTTGG TCGGCGGCGC GACTGCATGA

Protein sequence

MGIMTITVGI NGFGRIGRSY FRALLTSGAD IRVAAVNDLT SAQSLADLLK YDSVYGPLPQ 
QVAAEGSSLR VGDTVVEVLS ERDPAQLPWR RLGVDVVIES TGVFNDAAKA RAHIDAGASK 
VVVSAAAKNA DLTLVIGIND DLYDPQKHTV VSNASCTTNC LAPMARVLDD GLGIECGTMT 
TIHAYTQDQN LQDGPHPDPR RARAANLSTI PTTTNAASAI GLVLPNLKGK LDGYSVRVPV 
PVGSLTDLTV RVDRETTVEE VNSLFRKAAD GELARILRYT ADPVVSADIV KDPASCIFDS 
LLTQVIEGRH VHIFGWYDNE WGFSNRLIDT TQLVGGATA