Gene Franean1_5060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5060
Symbol
ID	5673396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6058881
End bp	6060071
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	76%
IMG OID	641243911
Product	prephenate dehydrogenase
Protein accession	YP_001509326
Protein GI	158316818
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.01744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.042313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTCCCG GCGAGCCCCC CACGGCGGCC GGGCGGTTCT CGCCGCCCTA CGTCCGCCCG 
GGGGTCGAGG CGGCCGCAGG GGGCTCGTCC GCGTGGGATC CGGCGCACCT GCCCGAGCTG 
CGCCGGGTGG CCGTCGTCGG GTCCGGGCTG ATCGGCACGA GCATCGGGCT GGCGCTGTCC 
GGGCGCGGCG TGGAGGTGTT CCTGCGTGAC TCCGACGACG CCCAGGTGAA GCTCGCCGAG 
GCGATGGGCG CCGGCCGGCC ATGGCAGGGC GAACGGGTCG ACCACGCGGT GATCGCCACC 
CCGCTGCCCA CCGTCGCCGC CGAGCTGCGC GACCTGCAGC GCGGCGGCCT GGCGACGACG 
GTCAGCGACG CCGGCAGCGT GAAGACCCGC CCGCTGGTCG AGGCCGTCCA GCTCGGCTGT 
GATCTCGGGG CCTGGTGCCC GGCCCATCCG ATCGCCGGGC GGGAGCGGCA CGGGGCGGTG 
TCCGCCCGCG CGGACCTGTT CGCCGAGCGG GTGTGGGCGG TCTGCCCGGT GGCCCACACC 
GGCGCGGACG CGATCGCGGC GACCGCCGCC CTCGCCCTCG CCTGCGGCGC GACACCGGTG 
CGCACCACCC CCGAGCGCCA CGACGCCGCG ATGGCCGTCC TCTCGCACGT TCCGCAGCTG 
GTGGCGAGCG TGCTCGCCGG GAGCCTGCTC GGCCTCGACT CGCACGACCT GCCGTTCGCC 
GGCCAGGGCT TCCGCGACAC GACCCGCCTC GCCGACAGCG ACCCCGTCCT GTGGGCGTCG 
ATCATCGAGG GCAACCGCGG GCCCATCGCC GAGCGCGTGC GCCGGCTGGG GCGGGAGTTC 
ACCCACCTCG CGGACGTGCT CGCCGAGGGG ACCCGTGACG AGGTGGTCGA GGCGGTCACG 
GCGGCGATCC ACGGCGGGCG GCACGGCCGG TCGCTGCTGC CCCGCAAGGC CGGTGCCCGG 
GCACTTCCGT GGGGCTGGGT CGGTGTGGTG CTCGACGACC GTCCCGGCCA GCTCGCGGCG 
CTGTTCGCCG TGATCGGCGA GTGGGACGTC AACATCGAGG ACGTCGGGCC GTTCGAGCAC 
AGCCTGGACG CCCCCGCCGG CATCGTCGAG ATCGCGGTCG ATCCGGACGG CGCGGACGGA 
CTCGTCGAAC GGCTGACGCG GGCCGGATGG ACGGCATATC GGCGCTCGTG A

Protein sequence

MSPGEPPTAA GRFSPPYVRP GVEAAAGGSS AWDPAHLPEL RRVAVVGSGL IGTSIGLALS 
GRGVEVFLRD SDDAQVKLAE AMGAGRPWQG ERVDHAVIAT PLPTVAAELR DLQRGGLATT 
VSDAGSVKTR PLVEAVQLGC DLGAWCPAHP IAGRERHGAV SARADLFAER VWAVCPVAHT 
GADAIAATAA LALACGATPV RTTPERHDAA MAVLSHVPQL VASVLAGSLL GLDSHDLPFA 
GQGFRDTTRL ADSDPVLWAS IIEGNRGPIA ERVRRLGREF THLADVLAEG TRDEVVEAVT 
AAIHGGRHGR SLLPRKAGAR ALPWGWVGVV LDDRPGQLAA LFAVIGEWDV NIEDVGPFEH 
SLDAPAGIVE IAVDPDGADG LVERLTRAGW TAYRRS