Gene Francci3_1455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1455
Symbol
ID	3903187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1745728
End bp	1746840
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	74%
IMG OID	637878792
Product	prephenate dehydrogenase
Protein accession	YP_480561
Protein GI	86740161
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00804434
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGTCGGGT TGGAATGGGA TGCCGCACGC CTTCCGCGCC TGCGCCGGGT CGGGGTCGTC 
GGCACGGGCC TGATCGGGAC CAGCATCGGT CTCGCGCTGT CGGCAAGGGG CGTCGAGGTC 
CTGCTCCGCG ACGTGGACGA GGCACAGGTC GCGCTTGCCG AGAAGATGGG GGCCGGGCGG 
CCGTGGGCGG GGGAGCGGGT CGATCATGCG GTCGTCGCCA CCCCACTGCC GAGTGTCGCG 
GTCCAGGTAC GCGCCCTGGC CCGCTCCGGC CTCGCGGACA CGATCAGCGA CGCCGGCAGC 
GTCAAGGTCC GACCGTTGGT CGAGGGAGTC CAGCTCGGCT GCGACCTCAC GACGTGGTGC 
CCGGCCCACC CCATCGCCGG CCGGGAACGG CACGGGGCCG TCTCCGCCCG GGCGGACCTG 
TTCGCCGAGC GGGTCTGGGC GGTCTGTCCC GTCCCCCACA CCGGGTCGGC CGCGGTGCAC 
GCCACGGTGG CGCTGGCGTT CGCCTGCGGG GCCACGCCGG TGCGGACCAC CCCGCAGCGT 
CACGACGCGG CGATGGCGTC GGTCTCCCAC GTGCCCCAGA TCGTCGCGAG CGCGCTCGCG 
GGGGCGCTCG TCGGGCTGCC GGAACGGGAC GTGCCCTTCG TCGGGCAGGG GTTCCGCGAC 
ACCACCCGGC TCGCCGACAG CGACGCCGAG CTGTGGTCGG GGATCATCGA GGGTAACCGC 
GGCCCGATCG CCGAGCGGGT GCGTTCCCTC GGCGCCCAGC TCACCGCGCT CGCCGACGTC 
CTCGACACCG GTTCCGGTGA CGAGGTCACC GCCGCGGTCT CCCGGCTCAT GCGGGGCGGC 
CAGGCCGGCC GTGCGCTGCT TCCGCGCAAG CCCGGCGCCC CGGCGCAGTC CTGGGGCTGG 
GTGGGGGTCG TGCTCGACGA CCGACCCGGC CAGCTCGCCG CGCTCGTCGG CTTCATCAGC 
CAGTGGCAGA TCAACATTGA GGATGTCGGG CCCTTCGAGC ACAGCCTTGA CGCACCCGCC 
GGCATCGTCG AGCTCGCGGT GGATCCGACG GCCGCGGACG AGCTCGTCGA CCGGTTGACG 
CTCAACGGCT GGACGGCATA CCGGCGATCC TGA

Protein sequence

MVGLEWDAAR LPRLRRVGVV GTGLIGTSIG LALSARGVEV LLRDVDEAQV ALAEKMGAGR 
PWAGERVDHA VVATPLPSVA VQVRALARSG LADTISDAGS VKVRPLVEGV QLGCDLTTWC 
PAHPIAGRER HGAVSARADL FAERVWAVCP VPHTGSAAVH ATVALAFACG ATPVRTTPQR 
HDAAMASVSH VPQIVASALA GALVGLPERD VPFVGQGFRD TTRLADSDAE LWSGIIEGNR 
GPIAERVRSL GAQLTALADV LDTGSGDEVT AAVSRLMRGG QAGRALLPRK PGAPAQSWGW 
VGVVLDDRPG QLAALVGFIS QWQINIEDVG PFEHSLDAPA GIVELAVDPT AADELVDRLT 
LNGWTAYRRS