Gene Franean1_1404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1404
Symbol
ID	5669810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1700587
End bp	1701693
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	68%
IMG OID	641240327
Product	integrase catalytic region
Protein accession	YP_001505754
Protein GI	158313246
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.731191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCTGCCG GACTGGGCCT GTGTCGGGCA GGCTGGATGG TCATGGTGTG GTCGCTGCTC 
TACGCCCTGA CACGCAACGC TCTCGGACTG ATGTTGCTCC ACGTGCGCGG CGACACCGCG 
AAAGACGTAG AGCTCCTCGT CCTGCGACAT CAGGTGGCGG TGTTACGACG GCAGGTGAAC 
CGTCCGACGC TGGAACCGGC GGATCGCGTC ATCCTCGCAG CCCTGTCCCG GCTGCTACCC 
CGGGCCCGCT GGGGTTCGTT CGTCGTCACC CCGGCCACCG TGCTGCGCTG GCACCGTGAG 
CTCCTCGCAC GCAAATGGAC CTACCCACGC AAGACCCCCG GACGGCCACC GGTCCGCCGG 
GAGATCCGCG ATCTGGCCCT GCGCCTCGCG CAGGAAAATC CGACCTGGGG CCACCGCCGG 
ATCCACGGCG AACTCGCCGG GCTGGGCTAC CCGGTCGGGG TCGCCACCGT CTGGCGGATC 
CTGCACCGCG CCGGCGTCGA CCCCGCACCC CGACAGGCCG ACACCTCCTG GCGCACGTTC 
CTGCCCGCGC AGGCCTCCGG CCTGCTGGCC TGCGATTTCT TCACCGTGGA CACCGTCTTC 
CTGCAACGGA TCTACGTGTT CTTCGTCGTC GAACACGCCA CCCGCCACGT TCATGTCCTC 
GGGGTCACGA AGCATCCGAC CGCGGCGTGG GTCACTCAGC AGGCACGGAA CCTGCTGATG 
GATCTCGACG AGCGTGGCCA CCGGTTCCGG TTCCTCATCC GTGACCGCGA CACGAAGTTC 
ACGGCTTCCT TCGACGCTGT CTTCGCCGGG GCTGGTATCG ACGTGGTACG CACACCACCG 
CAGTCGCCGC AGGCGAACGT GATCACGGAA CGCTGGGTCG GCACCGCCCG CCGGGAATGC 
ACCGACAGGC TGCTGATCGT CTCCGAACGG CACCTGACAT CGACCCTCAC CAGCTACGCG 
AAGCATTTCA ACACCCACCG GCCTCACCGC TCCCTCGGCC AGCACCCACC CGACCCGCCA 
CCCGTGCTCG CCCCGACGCC GGAGTCCACC GTCCGTCGCA CCCGCATCCT CGGCGGGCTG 
ATCAGCGAAT ATCGCAACGC CGCCTAA

Protein sequence

MPAGLGLCRA GWMVMVWSLL YALTRNALGL MLLHVRGDTA KDVELLVLRH QVAVLRRQVN 
RPTLEPADRV ILAALSRLLP RARWGSFVVT PATVLRWHRE LLARKWTYPR KTPGRPPVRR 
EIRDLALRLA QENPTWGHRR IHGELAGLGY PVGVATVWRI LHRAGVDPAP RQADTSWRTF 
LPAQASGLLA CDFFTVDTVF LQRIYVFFVV EHATRHVHVL GVTKHPTAAW VTQQARNLLM 
DLDERGHRFR FLIRDRDTKF TASFDAVFAG AGIDVVRTPP QSPQANVITE RWVGTARREC 
TDRLLIVSER HLTSTLTSYA KHFNTHRPHR SLGQHPPDPP PVLAPTPEST VRRTRILGGL 
ISEYRNAA