Gene Franean1_6862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6862
Symbol
ID	5675175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8365131
End bp	8366462
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	72%
IMG OID	641245711
Product	HNH endonuclease
Protein accession	YP_001511102
Protein GI	158318594
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.215288
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.885214
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACCG CGCGGAGTGT GCAGGTCGAC GGGGACGGTT CCAGTCCGGT TGACGTGCCG 
GAGCAGGAGA GAACGTTCGA GGGGCGGGTG CGTGGGCTGC TGGTGCGGAT CGGTGCGGCG 
GTCCGGTCGA TAGCGGCGGG GAACGCGGAC CTGCTGGGGC TGTTGGCGCA GTTCGCCGAC 
CTGCGGCCCC CGGCGGCCGG CCGGGAGGTT CTGTTCGACG AGTTCGCTCC TGAGGATGTC 
GCGGCGGTGC TGGGGGTGTC CCCGCAGGCC GCGGCGAGTC AGATGCTGTT CGCGTGCACG 
GTGGCGCGCC GGCTGCCCCA CGCGGTGGAG GCGTTGAAGG CCGGGGTGCT GGACGTGCAG 
CGGCCGCGTT CGTTGGAGAA CGCGGTCCGT CCGCTCGACG GTCCGCTCGC GGCGCAGGTC 
GAGGCCCGTG TGCTGGCCGG GGGTGCGCGG CCGACCCGGG GGGCGTTCAC GGATGCGTGC 
CGTCGTGCCG TGCACACGGT GGACCCGGCC GGCGCGGCCG AACGCGCGCG GGCCCGGAAG 
AAGGAACGGC GGGTACGGGT GTCACCGGGG GAGGACGGGA CGAGTTGCCT GTCGGCGGTG 
CTGCCCGCCG AGGAGGCGAC CGCCTGCTAC CAGCGGGTCG ATCAGATCGC CCAGGGGATC 
GCCGCGCACC GAACGGCCGA GGACAGTCGC AGTCGTGACC AGATCCGCGC GGATGTCCTC 
GTCGATCTCC TCTGCGGGCG GACCGAGCAT GCGGTGCCGC TGCCGTGCGA GGTGCAGGTC 
GTGGTCCCGG TGACGGTGCT GCTGGGGTTG GCGGAGGATC CCGGGGAGAT CCCCGGGTAC 
GGGCCGGTCC CCGCGGCGGT GGCCCGGGAG ATGGCCGCAC GGCCGGGGTC GACGTGGCGG 
CGGATCCTCA CCGACCCTCA GGGCACGCTC GTCGAGATCG CCGACCGGCG CCTACCGACC 
GCGGCTCAGG CCCGGCATGT GCGGGCACGG AACCGTAGCT GTGTCTTCCC GGGCTGCGCG 
CGTACGTCGC GACGCGCGGA TATCGACCAC ACGGTGGCGC ATGCGAGCGG CGGGTCGACG 
CTCACCCGGA ACCTCGGGCC TACGTGCCGC AAGCATCACC GCATGAAGCA CTCCGGCCGT 
TGGCGGCTGA CACAACCGCG GGAAGGAACG TTCGTCTGGA CGGGTCCGTT CGGGGCGACG 
CTCGTCACCC ACCCACATTC ATACATCGAA CCGCAGAACA AGGCCGGTAC GACGGGAGGG 
GGTGGTGATG AACCGTCGGG CCACACCGCC TCGGGGTGGA AAATACCCCA CGACACACAG 
CCACCCTTCT AA

Protein sequence

MNTARSVQVD GDGSSPVDVP EQERTFEGRV RGLLVRIGAA VRSIAAGNAD LLGLLAQFAD 
LRPPAAGREV LFDEFAPEDV AAVLGVSPQA AASQMLFACT VARRLPHAVE ALKAGVLDVQ 
RPRSLENAVR PLDGPLAAQV EARVLAGGAR PTRGAFTDAC RRAVHTVDPA GAAERARARK 
KERRVRVSPG EDGTSCLSAV LPAEEATACY QRVDQIAQGI AAHRTAEDSR SRDQIRADVL 
VDLLCGRTEH AVPLPCEVQV VVPVTVLLGL AEDPGEIPGY GPVPAAVARE MAARPGSTWR 
RILTDPQGTL VEIADRRLPT AAQARHVRAR NRSCVFPGCA RTSRRADIDH TVAHASGGST 
LTRNLGPTCR KHHRMKHSGR WRLTQPREGT FVWTGPFGAT LVTHPHSYIE PQNKAGTTGG 
GGDEPSGHTA SGWKIPHDTQ PPF