Gene Franean1_6734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6734
Symbol
ID	5675047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8189335
End bp	8190492
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	70%
IMG OID	641245583
Product	ATPase
Protein accession	YP_001510974
Protein GI	158318466
COG category	[R] General function prediction only
COG ID	[COG5271] AAA ATPase containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0140161
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0815898
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCC CTGCCCCGAC CCCCTCCGCC CCCGCCGCCT TTCGCCTAGC ACCAGGCGGA 
CTGCACGAAA TGGTCGCCCG CTACCTGCTC GATCACCCTT CCGCATCCCA CACACCGACC 
GCCGTGGCGA AGGCGTTGAC CCGTAGCAAC GGCGCCGTGG GCAACGCGCT GCACCGTCTG 
GCCGAGGCCG GGCAGGCGAC GTTGACCAGC ACCAAACCCC GCCGGTACAC GGCCACCCCC 
ACCACGCGGG ACGCATTCGG ACGGACCGGC ATACCGCCCG TGGCAAGGCC CCGCCCGGCC 
CCGGCACCGC CCCCGGCGGC GGTGCCGAAG CCCCGGCCGG CCCTTCCGCC CACGACGCCG 
GATGGGGGGA TCATCCGCCC GTCGGGGCAG GTGTACCGGC CCCGGAAGCT GGCGGACCTG 
CCCGACGTGG AAGTCCTGCG CAAGCTACGC ACGGCCGAAG TACCGGTCCT GCTCTACGGC 
CCGCCCGGTA CGGGGAAGAC GAGCGTGATC GAGGCCGCCT TCGGCGACGA TCTGATCACG 
ATCGCGGGGG ATGGTGACAC CCAGGTCGGT GACCTGATCG GTGAGTACAC CCAGACCCCC 
GACGGCCGGT ACGAGTTCGT CTACGGGCCG CTCATCACCG CCATGCAGGA GGGGAAGGTC 
CTCCTCGTCG ACGACGCCAC TCTGATCAGC CCGGCGGTGC TCGCGGTGAT GTACCCGGCG 
ATGGACGGCC GGAAAAGGAT CATCGTGAAG GCGCACAAGG GCGAGGCGGT AGAAGCAGCC 
CCCGGCTTCT ACGTGATCGC TGGACACAAC CCGGGTGTCC ACGGGGCGAT CTTGAGCGAA 
GCGTTGTCAT CCCGTTTCGC GGTGCAGGTC GAAGTGTCGA CCGACTTCGA TCTCGCCACC 
AAACTCAAGA TCGACAGCAG GGCGGTGCGG GTCGCGCGGA ACCTCGCGCG GCGCCGCGAG 
TCCGGGGAGA TCGGCTGGTC CCCGCAGCTG CGAGAGCTGA TCGCCTTCCA GAAGATCGCG 
GACGTGTTGG GTGTCCCGGC GGCGGCAGCG AACCTGATGG GGATCGCGCC GGCCGAGGAC 
CGGCCGGTGG TCGCGGACAC GGTCGAGAAG GTCTTCGGGA TCAAGCTCGC GCCCCTCGCC 
CTCGGCAAGC AGATCTAA

Protein sequence

MSSPAPTPSA PAAFRLAPGG LHEMVARYLL DHPSASHTPT AVAKALTRSN GAVGNALHRL 
AEAGQATLTS TKPRRYTATP TTRDAFGRTG IPPVARPRPA PAPPPAAVPK PRPALPPTTP 
DGGIIRPSGQ VYRPRKLADL PDVEVLRKLR TAEVPVLLYG PPGTGKTSVI EAAFGDDLIT 
IAGDGDTQVG DLIGEYTQTP DGRYEFVYGP LITAMQEGKV LLVDDATLIS PAVLAVMYPA 
MDGRKRIIVK AHKGEAVEAA PGFYVIAGHN PGVHGAILSE ALSSRFAVQV EVSTDFDLAT 
KLKIDSRAVR VARNLARRRE SGEIGWSPQL RELIAFQKIA DVLGVPAAAA NLMGIAPAED 
RPVVADTVEK VFGIKLAPLA LGKQI