Gene Franean1_5373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5373
Symbol
ID	5673707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6477492
End bp	6478448
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	71%
IMG OID	641244231
Product	NmrA family protein
Protein accession	YP_001509637
Protein GI	158317129
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.764024
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGAGA ACCGCACATA TCTGGTGATC GGAGCGCGTG GCTTCCAGGG AGACGCCGTG 
GCCCGAGCCC TGCTCGCCGA GGGCCTCGAT GTCCGCGGGT TCGCCCGGGG CTCTGGTGCA 
CCGGTCCCCG GCGCACCAGA GCTTCCGACC GTTCTGGGCG ACCTCGCCGA GCTCGACGAC 
GTCCGCAAGG CCTTTGTCGG CGTCACGCAC GCATCCGTGG TGCTGCCGCT GGTCTACGAC 
GTGGACCTGG TCCAGACCTA TGCGCGCAAT GTGGCCGCCG CCGCGCGTGA GGCGGGCGTG 
ACCCGACTGG TCTACAACAC CAACACCCCA TTGCCGGGGC AGGTCACCCC ATACGCGGCC 
TATGAGACCC GCCGCGCCGC CGAGGCCGTG CTGGCGGACG GTGATCTGCC GACGGTCGTG 
CTGCGCCCGC CGGTGTACCT GGACAACCTG TTCAGCCCGT GGAACGGGCC CGCGCTGATC 
AACGACGGGG TGCTGGCCTA TCCGCTGCCC GAGGGGTGCA GGGTCTCCTG GCTCTCGCAC 
GCGGACCTGG CCACGGCCAC CCTCGCGGCC CTGCACGGTG AGGGGCTCGA GGGAACGGTG 
CTGTCGTTGG GCGGCCCCGA CACGGTGACG GGAGGAGAGC TGGCACAGGT GTTCGCCGCC 
GCGCTCGGCA GGGACGTCGC CTACGTTCCG CTGGAGGTGA ACGACTTCGA GACGGGGCTG 
CGGACGGTGC TCGCCACGCC TGCCGCGGCA GGCGTGGCGG GAATCTACCG GTGGGCCTGC 
ACCGGCGGTG ACGCCGAGCT CTTCGTCGCC GACCACGACG AGGTCGAGCG TGTCCTGGGC 
GTCCGCCTCA CCCCGATCAA CGAGTGGGTC GCTGCCCAGC CCTGGAAAAT ATGGGCGGCC 
GCCCGCTCGA ACGGCGCCGG GACGCCGGAT CCGGTCAGAG CCGACCATGG CAGTTGA

Protein sequence

MSENRTYLVI GARGFQGDAV ARALLAEGLD VRGFARGSGA PVPGAPELPT VLGDLAELDD 
VRKAFVGVTH ASVVLPLVYD VDLVQTYARN VAAAAREAGV TRLVYNTNTP LPGQVTPYAA 
YETRRAAEAV LADGDLPTVV LRPPVYLDNL FSPWNGPALI NDGVLAYPLP EGCRVSWLSH 
ADLATATLAA LHGEGLEGTV LSLGGPDTVT GGELAQVFAA ALGRDVAYVP LEVNDFETGL 
RTVLATPAAA GVAGIYRWAC TGGDAELFVA DHDEVERVLG VRLTPINEWV AAQPWKIWAA 
ARSNGAGTPD PVRADHGS