Gene Franean1_3030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3030
Symbol
ID	5671410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3563155
End bp	3564657
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	73%
IMG OID	641241929
Product	hypothetical protein
Protein accession	YP_001507349
Protein GI	158314841
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCCGC CGGCGGGCCC GTTCGCCGAG GCCAGGGCGC GGTACCTCGC GCTGGAGGCG 
CTGCTCGCCG GGGCGGACGC CCGCGCTGGC CGGCACGACG AGGTCGAGGA CCTGATCGAG 
CGGGATGGCC GTGAGGTGCT GCGGGCGCTG CTGCAGGGCC ATCTTGACCT GCGTGCCCGT 
GAGGAGACGC GGGCCGACCC GCCACCGGTC GGTGCTGACG GGGTGGCCCG TACCCGGCTG 
GAACGCGGCC ATGGCCGGCG GCTGGTGTCC CAGTTCGGGC AGGTCGTGGT CAGCCGGCAC 
GCCTACCGGG CGGCGGGGGC GGGCAACCTG CATCCCGCGG ACGCGGTGCT GAACCTTCCG 
GCGGGGCTGT ACTCGCACAC GCTCGCGCGC AGGCTCGCCC TGGAGGTGAC CCGGGGCTCG 
TTCGACGACG CGGTCGACGC GGTCGCCCGC GCGACCGGCC AGGTGATGGG CAAACGGCTC 
GCCGTCGAGC TCGTCCGGAG CCTGGCCGCC GACATCACCG CCTTCTACGC CCAGCCACGG 
CCCGAGATCA CCCCCGCCGG CCGGCTGCTG GTCCTCCAGT TCGACGGCAA GGGCATCGTC 
ATGCGCCCCG AGGCGCTGCG CCCGGCGACC GCGAAGGCCG CCGAGGCGAG GAAGAACCGG 
CTGGCCACCC GGCTGTCACC CGGCGAGAAA GCCAACCGCA AACGGATGGC CGAGATCGCC 
ATCGTGCACG ACACCACCCC CGCGCCGCGC ACCGTCGACG ACGTCATCCC CCGCCGCGGC 
AACGCCCAGG CCAGCGGCCA GCCCCGGGCG GACGGGCCGA CGGCCACCGG GACCTGGCTG 
GCCGCCTCCG TCGTCGACGA CATCGCCACC GTCATCGCCG CCGGCTTCGA CGAGGCCGAA 
CGCCGCGACC CCCACCAGCA GCGGACCTGG GTCGTGCTCG TCGACGGCAA CAACACCCAG 
CTCGACGCGA TCCACGCCGA GGCCACCCGC CGCGACGTCA CCATCACCGT CATCGTCGAC 
TTCATCCACG TCCTCGAGTA CCTCTGGACC GCCGCCTGGT CGTTCTTCGA CAAGGGCGAC 
CCCGACGCCG AGGACTGGGT CCACGCACAG GCCCGCGGCG TGCTCGCCGG CAAGGCCCAC 
GCGATCGCCT CCGGGTTCCG CCGCCGCGCG ACCCGCAACC ACTACAACGC CACCGAACGC 
AAGGGCGCCG ACACCGCCGC CGACTACCTC GACGCCAAGG CCCCCTACCT GGGCTACGAC 
CTCGCGCTCG CCAACGGCTG GCCGATCGCG ACCGGCGTCG TCGAGGGCTC CTGCCGCCAC 
CTCATCAAGG ACCGATTCGA CATCACCGGA GCCAGATGGG GCCTCGACGG CGCCGAAGCA 
GTCCTCCTCC TCCGCGCAGT CGTCACCAAC GGCGACTTCG ACGCCTACTG GGCTTACCAC 
CTCGACCAGG AACAGCACCG CAACCACCAC ACCAAGTTCG CCGAACACTA CACACCGACT 
TGA

Protein sequence

MPPPAGPFAE ARARYLALEA LLAGADARAG RHDEVEDLIE RDGREVLRAL LQGHLDLRAR 
EETRADPPPV GADGVARTRL ERGHGRRLVS QFGQVVVSRH AYRAAGAGNL HPADAVLNLP 
AGLYSHTLAR RLALEVTRGS FDDAVDAVAR ATGQVMGKRL AVELVRSLAA DITAFYAQPR 
PEITPAGRLL VLQFDGKGIV MRPEALRPAT AKAAEARKNR LATRLSPGEK ANRKRMAEIA 
IVHDTTPAPR TVDDVIPRRG NAQASGQPRA DGPTATGTWL AASVVDDIAT VIAAGFDEAE 
RRDPHQQRTW VVLVDGNNTQ LDAIHAEATR RDVTITVIVD FIHVLEYLWT AAWSFFDKGD 
PDAEDWVHAQ ARGVLAGKAH AIASGFRRRA TRNHYNATER KGADTAADYL DAKAPYLGYD 
LALANGWPIA TGVVEGSCRH LIKDRFDITG ARWGLDGAEA VLLLRAVVTN GDFDAYWAYH 
LDQEQHRNHH TKFAEHYTPT