Gene Franean1_1827 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1827
Symbol
ID	5670229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2192134
End bp	2193333
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	77%
IMG OID	641240748
Product	hypothetical protein
Protein accession	YP_001506171
Protein GI	158313663
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.197426
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAGA ACCCGGCGGG TTTCGGGCAG CCGGACGCTG ACCCCGACGA GATCCCCACC 
GAGCCGACTT CACCCCCCGC GGCGGGCGCG GCAGCGGCGG CGGATCAAGC GGCTGCCGGT 
GGTTCGGGCT CCGCGGGAGC CCCCGGCTCA GGCCGTCCGG TGGAGTCGCC GAACGCGGAA 
GCGGGAGCTG CCGGCTCTGG CGAGGGACGA GAGGACGGCA CGGCACCGGA TGCCGGTTCG 
CCGCAGGCGG CTGGTTCCCC CGATACGGCT GGTTCCCCGG AGGCGACTGG TCCGGACACG 
GCTGGTTCCC CGGATCGGGG GGCCACGCGC GCCGACACCG CCTCACCGAG CCTGACCGAC 
AGCGGGGCTG ACGGGGCGGG CCGGCGGACC CCCCGGGAGC GCCGCTCACC GGCCGCCGAC 
GAGGCGGCCT TCCTCGAGCT GATCGCCCGG TTCGACCAGG AGCCGCCGCC GGGCGAGCGG 
CTGTGGCCGG CCGCCGAGGA CGTCGACGAG CCCCGACGGC CGTCCGTCAT CATCATCAGG 
CCCGCGGGTC GGCAGCCCGA CGGCATGCCG CCGGACGGGC GCCACCTCGC CGGCGACGAC 
ACCGACCCGG GCACCGAGCG CACCGAGCCG CCGTCCCCGC TCGGCCGCGG TACGGACGGC 
GCCGCCCCGG TGGACCTCGA CGGGACGGGC GCGGACCACC CCAACGCCGA CCTGACCGGT 
GCCGACCCGG CCGGCACCGA TCACACGGGC GCCGGGAAAG CAGGCACGGG CCGCCAGGGC 
GGCGGCCGGG GCGAGGCCGG GGCCGACGAC GAAGCGGACC GCGCGGGAAA CAGCCGCGGG 
CGGGACAACC GCTCCCCGCT CGACGGCATC GCGGGGCTCG ACGCCGCCGT GCGGGCCGCC 
TTCGGCACCG CGGGTCGCGA CGCTCCCGAG TATCCGGGCG CGGACGACGA CGATCACTAC 
GTGCCGCCGC CACCACCGCC GGTCCCGAAG CTGCGGCCGG TCACCCGCTG GGCGCTGGGC 
TCCATCGCGC TCGGCGTCGC GATCCTGGTG GTCCCGACCC TGATCGGGCT CAACCATTCA 
CGTTCCCAGG ACGTCGCGGG CGTCCTGCTC ATTCTCGGAG GCGTCGGGAC GCTCGTGGCC 
CGCATGGGCG ACCGGCCGCC GACGGACTTC GACGGACCGG ACGACGGCGC GGTCGTCTGA

Protein sequence

MPENPAGFGQ PDADPDEIPT EPTSPPAAGA AAAADQAAAG GSGSAGAPGS GRPVESPNAE 
AGAAGSGEGR EDGTAPDAGS PQAAGSPDTA GSPEATGPDT AGSPDRGATR ADTASPSLTD 
SGADGAGRRT PRERRSPAAD EAAFLELIAR FDQEPPPGER LWPAAEDVDE PRRPSVIIIR 
PAGRQPDGMP PDGRHLAGDD TDPGTERTEP PSPLGRGTDG AAPVDLDGTG ADHPNADLTG 
ADPAGTDHTG AGKAGTGRQG GGRGEAGADD EADRAGNSRG RDNRSPLDGI AGLDAAVRAA 
FGTAGRDAPE YPGADDDDHY VPPPPPPVPK LRPVTRWALG SIALGVAILV VPTLIGLNHS 
RSQDVAGVLL ILGGVGTLVA RMGDRPPTDF DGPDDGAVV