Gene Franean1_1816 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1816
Symbol
ID	5670218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2179310
End bp	2180650
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	74%
IMG OID	641240737
Product	hypothetical protein
Protein accession	YP_001506160
Protein GI	158313652
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.093427
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0652436
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCGACC AGACCCCTCC TGGCCAGCCC TCCCCCGGTC CGGAGAACCA GGAGACCTGG 
AGGGCCCCCA ACAACTCGTG GCAACAGCCA CCGGATGCCG GCGGCCAGGC GGGCGGAGCG 
CCCGCGGCGG CCGGTGCTCC CGGCGCGGGC CAGGGCGGCC TGCCGTCCAC CACCCCGCCG 
CCGGCGCCCG TGCCGCAGTG GGGCACCGGC GCGCCGGGCC AGGAAGGCGG CGGATGGCCG 
TCCACCACGC CCGGGGGCGG CGGGGCAGGC GGCGGATGGG GCACGCCACC GGCCGGCGGG 
CCCAACCCGG ACGGTTCGTG GCCCGGGGCG GGACAGCAGC AGTGGCCCCA GCAGGGCACC 
GATACGCCCT GGGGGCAGCC GGGCCAGCCC GGCACCGGAT GGCAGCAGCC CGCCGGCTAC 
CAGCAGGGTG GCACCCCGGG CCAGTACCAG CAGGGCTACC AGCAGCCGGC TGACTACCAG 
CAGCAGGGGT ACCAGCAGCC CGGGTATCAG CAGCCCGCCG ACTACCAGCA GCAGGGGTAC 
CAGCAGCCTG GCTACCAGCA GCCCGCCGAC TACCAGCAGC AGGGGTACCA GCAGCCTGGC 
TACCAGCAGG GCTTCCCCCA GCAGCAGGGC TTCCCCCAGC AGCAGGGCAA CTGGCAGCAG 
CCCGGCGGCC CGCCACCGGC CCGGCCCCGC CGGAACCCGG CGATGATCAT CATTCCGGTG 
GCCGTCGTCG CGGTCATCGT CCTCGGGGTG GTGATCGCCC TCGCGGCCGG CGGCGACGAC 
TCGAAGCCGA CGGCCACGCC GCCGGCGGTC ACGAACCTGG GCCCGGGCAC CGTGCCCACC 
CTGACGGCAC CCGCCGTCCC GGGTACGACG ACGGCCCCGC AGCAGCCTGC CGGCCCCGCC 
GGATGCACGC CGGTCGTGCC GCAGGGCGCG CCGCCCGCGG GCACCCTGAC CCTGGGCGGG 
ACGGGCACGG TGGTCGGCAC CGCGAGCTCG TCGGTCAGCG ACTTCGAGGC CAAGGTGACG 
CTGAACAGCA TCTGCAGCAC CACCGGCCCG GCCGCCGACT ACTCCGATCC GCCGGTGCAG 
GGCGCCAACT ACATCCTGAA CGTGACCGTC GAGACCGTCC GCGGCGAGAC GACCGCGTCA 
CCGGACGACT TCTACATCCA GACCTCGGAC GGCAGCCGGT ACGACGGCTC CTTCACCACG 
GTCGAGCCGA AGCTGTTCAC CCTCGATCTG AAGGCCGGTC AGAAGGTGCG CGGCAACGTG 
GTCATCGACG CCCCGGCGGG TCACCACATC CTGTCCTGGG AGCCGCTGTT CGCGACGCAG 
CCGGCGAAGT TCCAGTTCTG A

Protein sequence

MTDQTPPGQP SPGPENQETW RAPNNSWQQP PDAGGQAGGA PAAAGAPGAG QGGLPSTTPP 
PAPVPQWGTG APGQEGGGWP STTPGGGGAG GGWGTPPAGG PNPDGSWPGA GQQQWPQQGT 
DTPWGQPGQP GTGWQQPAGY QQGGTPGQYQ QGYQQPADYQ QQGYQQPGYQ QPADYQQQGY 
QQPGYQQPAD YQQQGYQQPG YQQGFPQQQG FPQQQGNWQQ PGGPPPARPR RNPAMIIIPV 
AVVAVIVLGV VIALAAGGDD SKPTATPPAV TNLGPGTVPT LTAPAVPGTT TAPQQPAGPA 
GCTPVVPQGA PPAGTLTLGG TGTVVGTASS SVSDFEAKVT LNSICSTTGP AADYSDPPVQ 
GANYILNVTV ETVRGETTAS PDDFYIQTSD GSRYDGSFTT VEPKLFTLDL KAGQKVRGNV 
VIDAPAGHHI LSWEPLFATQ PAKFQF