Gene Franean1_5057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5057
Symbol	engA
ID	5673393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6055362
End bp	6056750
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	75%
IMG OID	641243908
Product	GTP-binding protein EngA
Protein accession	YP_001509323
Protein GI	158316815
COG category	[R] General function prediction only
COG ID	[COG1160] Predicted GTPases
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR03594] ribosome-associated GTPase EngA

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0472211
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCG AAGATCTCGC CGCGTCCGTC GACGACGGCC CTGTGGGCGG TGCCCTCCCG 
CTGGCGGGAG GGCAGCCCGT CCTCGCCGTC GTCGGCCGGC CGAACGTGGG CAAGTCGACG 
CTGGTCAACC GCATCCTGGG CCGCCGCGCG GCCGTCGTCG AGGACGTCCC CGGCGTCACC 
CGTGACCGGG TCGCCTACGA CGCGGTGTGG AACGGCCGCC GGTTCACCCT CGTCGACACC 
GGCGGCTGGG AGCCCGACGC CCGCGGCCTC GCCGCCCGGG TCTCCGACCA GGCCCGCGCC 
GCGCTCGACA CCGCCGACGG CGTGCTGTTC GTGATCGACG CCACCGTCGG CGCGACCGAC 
GCCGACGAGG CCGTCGCCCG GGTGCTGCAC CGGTCGGGCC GGCCGGTGAT CCTCGCCGCG 
AACAAGGTCG ACGACGCCCG CGCGGAGGCC GACGCCGCCG CGCTGTGGAG CCTCGGGCTG 
GGCGAGCCGT ACCCGGTGTC CGCGCTGCAC GGCCGGGGCA GCGGCGACCT GCTGGACGCC 
GTCCTCGCGG TGCTGCCCGA GGCACCCCGC GAGCGGTTCA CCGAGGAGGA CGGCCCCCGG 
CGCGTGGCGC TGATCGGGCG GCCGAACGTC GGCAAGTCCA GCCTGCTCAA CAAACTGGCC 
GGCAGCGAGC GCTCGCTGGT GCACGACGTC GCGGGCACGA CCCGCGACCC GGTGGACGAG 
CTCGTCACCG TCGGCGGCGA GACCTGGATG TTCATCGACA CCGCCGGCCT GCGGCGGCGG 
GTGAAGGAGG CCTCCGGCGC CGAGTACTAC TCGTCGCTGC GCACCGCCTC CGCGCTGGAG 
GCCGCCGAGG TCGCGATCGT CCTGCTCGCC GCGGACGAGC CGGTCACCGA GCAGGACCAG 
CGGATCATCA GCATGGTCAC CGACGCCGGC CGGGCCCTCG TCCTCGCCTT CAACAAGTGG 
GACACGCTCG ACACCGAGCG CCGTCTCGAC CTGGAGCAGG AGATCGTCCG CGAGCTGGGC 
CGGGTGGCCT GGGCGCCGCG GGTGAACATC TCGGCCCGCA CCGGCCGCGC CACCGACCGG 
CTCGCCCCGG CGCTGCGGAC GTCCCTCGAC TCGTGGGGAA CGCGCATCCC GACCGGCCGC 
CTCAACGCCT GGATCGGAGA GGTCGTGGCG GCCACGCCGC CGCCGTCGCG GGGCGGGAAG 
CTGCCGCGGG TGCTGTTCGC GACCCAGGCC GGGGTGCGCC CGCCGCGCTT CGTCGTGTTC 
ACCACCGGAT TCCTCGAGCC GGCCTACCGG CGTTTCCTGG AGCGCAAACT GCGCGAGGAC 
TTCGGCTTCG CCGGCACGCC CATCGAGATC TCGATCCGGG TCCGCGAGCG TCCCGACCGC 
CACCGCTAG

Protein sequence

MNTEDLAASV DDGPVGGALP LAGGQPVLAV VGRPNVGKST LVNRILGRRA AVVEDVPGVT 
RDRVAYDAVW NGRRFTLVDT GGWEPDARGL AARVSDQARA ALDTADGVLF VIDATVGATD 
ADEAVARVLH RSGRPVILAA NKVDDARAEA DAAALWSLGL GEPYPVSALH GRGSGDLLDA 
VLAVLPEAPR ERFTEEDGPR RVALIGRPNV GKSSLLNKLA GSERSLVHDV AGTTRDPVDE 
LVTVGGETWM FIDTAGLRRR VKEASGAEYY SSLRTASALE AAEVAIVLLA ADEPVTEQDQ 
RIISMVTDAG RALVLAFNKW DTLDTERRLD LEQEIVRELG RVAWAPRVNI SARTGRATDR 
LAPALRTSLD SWGTRIPTGR LNAWIGEVVA ATPPPSRGGK LPRVLFATQA GVRPPRFVVF 
TTGFLEPAYR RFLERKLRED FGFAGTPIEI SIRVRERPDR HR