Gene Franean1_1549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1549
Symbol
ID	5669952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1851020
End bp	1852417
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	73%
IMG OID	641240468
Product	hypothetical protein
Protein accession	YP_001505894
Protein GI	158313386
COG category	[L] Replication, recombination and repair
COG ID	[COG0210] Superfamily I DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.400172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.819759
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCACCGG ACCTGGTCGA ACAGCTGCTC ACCCGCCTCG CGGACGGCTG CCCGCCGATG 
CCCGGCGCCA CGGACCCGCC GGCACCGTCC AGGCCCTCGG GGGACGAGGT GGCGGGCCAG 
GGCACGCTCC TGAGCCACAA GGACCTCTGG CGCGAGCTCC TCGACGCCGC GGACCGCGAG 
CCCATCGAAT CCTGGATGAC CTGGCTGCAC CCGAAGCAGG TCCGGCTGGC CGGACGGCAG 
TGGTCGGGGC CGGCCCGCGT GCGCGGCGCG GCCGACACCG GCAAGACGGT CGTCGCACTG 
CACCGCGCCA AGTACCTGGC CGCGCGCGGG GAACGGGTGC TGTTCACCAC GCTGGTGCGG 
ACCCTCGGCC CGGTCTACCG CGCGCTGCTC GCCCGGATGG CCCCCGACCA GGTCGACCGG 
GTCGAGTTCG CCACCGTGCA CGCCGTCGCC GCCCGCTGCC TGCGCGAGCA CGGCCTGACC 
GACTTCGCGC AGTACGCGAA GCTGGCCCGG GTCGGGCGCA GCACCCCTTT ACAGCCGACC 
CACCGCCGCG CGGTGTGGGA GCTCCACGAG CGGTACGAGC AGCTCCGGGT GGAGCGCGGC 
GTCCTCGACC GCGAGCGGAT TCTGCGCTAC GCCCAGGCGG TGCTCGCCGA CGACAGCTTC 
GAGGATCTCG ACGGCGTTCG GGAGCAGGGG CACCGCGAGG TCGACGTCGA GCGCCCCGGC 
GGCGAGATCC ACGAGGTCAC CGTGTCCGGC GAGGCGGCAC AGGACACCGC GCTCTGCGAC 
CATCTCGTCG AGCTCCGGCA GCGCCGGAAC GTGCGTTACG GCGACATGGC GGTGCTTGTG 
CCGACGAACG AATCGGAGCG GCGATGGCTG CGGGTGCTCG CCGAACGGGG AATTCCCGCG 
GTCTCCCTCA TGCAGTACGA CGGGTCCACC TGCGAGGCGG TCAAGGTCGG GACGTACTTC 
CGCGCCAAAA GCCTCGATTT CGCCCACGTC TGCATTCCCG ACCGTAATCT CTTCCCGCGG 
CCGCAGCAGC CGTCCGAGTC GGCCGACGCG TTCGGTGAAC GCGTCCAGCT GGAGCGGCGG 
CAGTTGTACG TCGCCATCAC GAGGGCTCGG GACAGTGTGT GGGCCGGCAT TCACGCCCGG 
CCCTGCCCGG AACACCAGCC GCCCGGCATC GGTCGGATGC CGGTCCGAGC CGGGACGAAC 
GGTGCGCAGA CGGTCTACTC GGACGGGACC GGTCCTGGAC GTGACCGCGG CACGGTCGCC 
AGCGGCACGG TGGCCGACGG GTCGGCAAAT GACGGACCGC CGAATGCCGG GAAGTCGTGG 
GCGGGGACGC CGTGTTCCGG GCGGTGGGGT TCCGGGGTGG CGGGTCGCTG GATGTCGCCG 
CGGGTGACCG CGAGGTAG

Protein sequence

MAPDLVEQLL TRLADGCPPM PGATDPPAPS RPSGDEVAGQ GTLLSHKDLW RELLDAADRE 
PIESWMTWLH PKQVRLAGRQ WSGPARVRGA ADTGKTVVAL HRAKYLAARG ERVLFTTLVR 
TLGPVYRALL ARMAPDQVDR VEFATVHAVA ARCLREHGLT DFAQYAKLAR VGRSTPLQPT 
HRRAVWELHE RYEQLRVERG VLDRERILRY AQAVLADDSF EDLDGVREQG HREVDVERPG 
GEIHEVTVSG EAAQDTALCD HLVELRQRRN VRYGDMAVLV PTNESERRWL RVLAERGIPA 
VSLMQYDGST CEAVKVGTYF RAKSLDFAHV CIPDRNLFPR PQQPSESADA FGERVQLERR 
QLYVAITRAR DSVWAGIHAR PCPEHQPPGI GRMPVRAGTN GAQTVYSDGT GPGRDRGTVA 
SGTVADGSAN DGPPNAGKSW AGTPCSGRWG SGVAGRWMSP RVTAR