Gene Franean1_6456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6456
Symbol
ID	5674771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7849889
End bp	7850866
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	76%
IMG OID	641245304
Product	heat shock protein DnaJ domain-containing protein
Protein accession	YP_001510699
Protein GI	158318191
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00677011
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGTGATA CGCCAAAAAG CCAGTCGGCC CAGTACTTGC GGGCCTCGAT GTACGAGGTG 
CTCGGGATCG CACCCACGGC TTCGGACGAG GAGGTCCATG CCGCCTATCG GCGCGTGGTG 
AAACGCGCCC ATCCGGACGC CGGCGGATCC CAACGCGCGT TCCTCCGGGT GAACGCGGCG 
TACCGGGTGT TGAGCGACCC CGGTATGCGG CGAGCCCACG ATCTGTGGCT CGCCCATCTG 
CTCGACGCAT ATGACCAGCC GGGACGCTCC GGCGGCGCGC GCCCGCCCGG CGGGCGGGCC 
GCGCCCGGCG GGCGCCACCC CGCCGACGGG CGTCCCGGAT CCGACGGACG AACGAACCCG 
GGCGGGCGCA CGTCGCCCGG CGGGCAGGCG GACAACCCCG GACGGGGGGC TTCCGGCAAT 
CGGGGCACCT CGGATGACCC GGCACCCCCC TCGGGGGGTG CCGCCCCGGG CCGGCGGGGA 
GCGTCCGGCC GGGCCTCCGA TCAGAGGGGG CCAGGCAAGG GCACGGACTC CGCCAGCGGA 
TGGGGCGAGG CCGGTGGCTG GGCCGCCACC GGTGGCTGGG GCGATGCCAC TGCCGCTCCC 
CTACCCGAGG ATGGCCGGGC GTCCGGCGGG CGGCGACGCT CGCGCCGGCG CCCACCAGCC 
GACGCCGCCG AGTGGGTCGT GGGGCCCGAC CAGGCCATGA CACCGGACGG CGGCCCAGCC 
GGGCCGCCCC CGTACGAGGC ACCCGGCGGG GCCGCGACCT GGGCCACCTG GCCGGACGAG 
GACTACCCCA CGCGGGGTCC CGGCCGGCGG GCACGGCGCA GGTACCTGGT CTCGATGGCG 
CTGTGCCTGG CCCTGTTCGT GCTGGCGGGC GCGGTGGTGC GGCTCTACTC CGTCCCGGTG 
GCGATGGGCA TGATGCTGGC CTCGATGGTG ATCCCGCCGG TGGCGGTCCT CGCGGTCAAC 
GCCGCACGCC GCCGCTGA

Protein sequence

MRDTPKSQSA QYLRASMYEV LGIAPTASDE EVHAAYRRVV KRAHPDAGGS QRAFLRVNAA 
YRVLSDPGMR RAHDLWLAHL LDAYDQPGRS GGARPPGGRA APGGRHPADG RPGSDGRTNP 
GGRTSPGGQA DNPGRGASGN RGTSDDPAPP SGGAAPGRRG ASGRASDQRG PGKGTDSASG 
WGEAGGWAAT GGWGDATAAP LPEDGRASGG RRRSRRRPPA DAAEWVVGPD QAMTPDGGPA 
GPPPYEAPGG AATWATWPDE DYPTRGPGRR ARRRYLVSMA LCLALFVLAG AVVRLYSVPV 
AMGMMLASMV IPPVAVLAVN AARRR