Gene Franean1_4049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4049
Symbol
ID	5672407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4827989
End bp	4829071
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	76%
IMG OID	641242925
Product	pyruvate carboxyltransferase
Protein accession	YP_001508342
Protein GI	158315834
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.651223
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.299101
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCAGC CTGATCCGCG CCGGCCCGAC CCGTACCGGC CCGACGCGCG CCAGCCAGGT 
GGGCTCCAGC CGGACGTCCA CCGGGCGGAC GGCCTGCCCG AGTCGGTGAC GATCTACGAG 
GTGGGCCCTC GCGACGGGCT GCAGAACGAG GCCTCGGTCG TCGACGTGGC GGTCAAGGCG 
GAGTTCGTCC GGCGGCTCGC CGGCGCCGGG CTGCGGGCGA TCGAGACGAC GAGCTTCGTC 
CCGGCGGCCT GGGTTCCGCA GCTCGCCGAC GCGGCGGAGC TGCTGGAGCT GCTGGGCCCG 
CCGCCGCGGG GCGCCCGGCG GCCGGTGCTG GTCCCGAACA CGCGGGGGCT GGAACGGGCC 
CTGGCGGCCG GGGCCGGCGA GATCGCGGTT TTCGGCAGCG CCACCGAGAC CTTCGCGCGG 
CGCAACCTCA ACCGCACGGT CGACGAGTCG CTGGCGATGT TCGAGCCGGT GGTGACGGCG 
GCCCGGGCCC GGGGCCTGGC GGTCCGCGGC TACCTGTCGA TGTGCTTCGG CGACCCGTGG 
GAGGGCGCCG TCCCGCCCGG GCAGGTCGCC GCGATCGCCC GGCGCCTGGT CGACCTCGGT 
GTTGACGAAC TGTCGCTGGG CGACACCATT GGAGTGGCCA CCCCCGGCCA CGTCGAGGCC 
CTGCTCGCCG AGCTGGCCGC GGCCGGGATC GGCCCGGGGA CCCTCGCGGT GCACTTCCAC 
GACACCTACG GCCAGGCTCT CGCCAACACC CTTGCCGCGC TGCGCGCCGG GGTGCGCACG 
GTCGACTCGT CCGCGGGCGG CCTCGGCGGC TGTCCGTACG CGAGGAGCGC GACCGGCAAC 
CTCGGCACCG AGGACCTCGT CTGGATGCTG CACGGCCTCG GCGTCGGCAC CGGCGTCGAC 
CTCGGGGCGC TGGTGCGCAC CAGCGTGTGG ATGGGGGAGC GGCTGGGCCG GCCGAGCCCG 
TCACGAGTCG TGCACGCGCT GGCAGCGCGG CTCGCCGAGG ACGGTCTCGC CGAGGACGGT 
GCCACGGCGG ACGGATGTAG TGAAGCAGGA GAAGGAGACG GGCCATGCCT GACAGCCGGC 
TGA

Protein sequence

MPQPDPRRPD PYRPDARQPG GLQPDVHRAD GLPESVTIYE VGPRDGLQNE ASVVDVAVKA 
EFVRRLAGAG LRAIETTSFV PAAWVPQLAD AAELLELLGP PPRGARRPVL VPNTRGLERA 
LAAGAGEIAV FGSATETFAR RNLNRTVDES LAMFEPVVTA ARARGLAVRG YLSMCFGDPW 
EGAVPPGQVA AIARRLVDLG VDELSLGDTI GVATPGHVEA LLAELAAAGI GPGTLAVHFH 
DTYGQALANT LAALRAGVRT VDSSAGGLGG CPYARSATGN LGTEDLVWML HGLGVGTGVD 
LGALVRTSVW MGERLGRPSP SRVVHALAAR LAEDGLAEDG ATADGCSEAG EGDGPCLTAG