Gene Franean1_4382 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4382
Symbol
ID	5672735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5227800
End bp	5229218
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	68%
IMG OID	641243251
Product	phosphoenolpyruvate carboxykinase
Protein accession	YP_001508668
Protein GI	158316160
COG category	[C] Energy production and conversion
COG ID	[COG1274] Phosphoenolpyruvate carboxykinase (GTP)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGTCA CGATCCCGGG CCTACAGCCG ACGCCGACGA CACACCCGGC ACTGTTGGAG 
TGGGTCGCCA CGATCGCCGA CCTCACCCGG CCCGACCGGG TTCACTGGTG CGACGGCAGC 
GACGCCGAGT ACGACCAGCT CTGCGCGGAG CTCGTCGACA AGGGCACGTT CCTCCGTCTC 
GCCGAGGACA AGCGGCCCGG CAGCTACTAC GCCGCGAGCG ACCCCAGCGA CGTCGCCCGC 
GTCGAGGACC GCACCTTCAT CTGCTCGAGG AGCCAGGACG ACGCCGGTCC GACGAACAAC 
TGGACCGACC CGGACGAGAT GCGCATCACC CTGCGGGGCC TGTTCGCGGG TTGCATGCGG 
GGCCGCACCA TGTACGTCGT CCCGTTCTGC ATGGGATCGC TAGGCTCACC GATCTCCGCA 
CTCGGCGTCG AGATCACCGA CTCGGCCTAC GTCGCGGTCT CGATGCGTGT AATGACCCGA 
ATGGGCCAAC CGGCACTCGA CCAGCTCGGA CAGGACGGCT TCTTCGTCCC CGCCGTGCAC 
AGCGTCGGCG CGCCGCGCCA GCCCGAGCAA CCCGACGTCG CCTGGCCCTG CAACGCCACC 
AAGTACATCG TCCACTTCCC CGAGACACGA GAAATCTGGA GCTACGGCTC CGGCTACGGC 
GGCAACGCCC TGCTCGGCAA GAAGTACTAC GCGCTACGGA TCGCCTCGGT GATGGCCCGC 
GACGACGGCT GGCTCGCCGA GCACATGCTG ATCCTCAAGC TCACCGGACC CGACGGGAAC 
ACCCATTACA TCGCGGCCGG CTTTCCGAGC GCCTGCGGCA AAACCAACCT CGCCATGCTC 
GTCCCGACCA TCCCCGGCTG GAAGGTCGAG ACCATCGGGG ACGACATCGC CTGGATGCGC 
TTCGGAGACG ACGGACGGCT CTACGCCGTC AACCCCGAGG CCGGCTTCTT CGGCGTCGCG 
CCGGGCACCG GCCGGACGAC CAACCCCAAC GCCATCGACA CGATCCACAG CAATGCGATC 
TTTACGAATG TCGCGCGCAC CGATGACGGA GACGTGTGGT GGGAAGGGCT GACCAAGGAA 
CCCCCGGCAC ATCTCATCGA CTGGCAGGGC CGCGACTGGA CACCACAGTC CGCGACGCCG 
GCCGCGCATC CCAACGCCCG TTTCACCGCC CCCGCCAGCC AATGCCCGAC GATCGCTGCG 
GAATGGGCCG GCCCGGCGGG CGTTCCGATC TCCGTTGACT GTGCCGCCTG GGAACACGAA 
AACCGACACG ATCCGTCGAT ACTTCACCGA CCTCGGCCCC CGCATGCCCG ACGCTCTCTG 
GGTCGAACTC GCGGCCCTCG CCGACCGGCT GCGCTGACAC CGTCTCCCAC GCCTCACACC 
CTCCGTGAGC CAACGGGTTC GGCCGCCGCC ACAGCCTGA

Protein sequence

MPVTIPGLQP TPTTHPALLE WVATIADLTR PDRVHWCDGS DAEYDQLCAE LVDKGTFLRL 
AEDKRPGSYY AASDPSDVAR VEDRTFICSR SQDDAGPTNN WTDPDEMRIT LRGLFAGCMR 
GRTMYVVPFC MGSLGSPISA LGVEITDSAY VAVSMRVMTR MGQPALDQLG QDGFFVPAVH 
SVGAPRQPEQ PDVAWPCNAT KYIVHFPETR EIWSYGSGYG GNALLGKKYY ALRIASVMAR 
DDGWLAEHML ILKLTGPDGN THYIAAGFPS ACGKTNLAML VPTIPGWKVE TIGDDIAWMR 
FGDDGRLYAV NPEAGFFGVA PGTGRTTNPN AIDTIHSNAI FTNVARTDDG DVWWEGLTKE 
PPAHLIDWQG RDWTPQSATP AAHPNARFTA PASQCPTIAA EWAGPAGVPI SVDCAAWEHE 
NRHDPSILHR PRPPHARRSL GRTRGPRRPA ALTPSPTPHT LREPTGSAAA TA