Gene Franean1_3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3102
Symbol
ID	5671481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3660747
End bp	3662210
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	66%
IMG OID	641242000
Product	radical SAM domain-containing protein
Protein accession	YP_001507420
Protein GI	158314912
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGTGC TGCTGGTCCA TCCCAGTGCG TTGATGTATT CGGAGATCTT CCTGCGACTC 
GAGCCTCTGG GTCTTGAACG CGTGGCCGCA TCGCTGCTCA TGGCCGGGCA CGAGGTCCGC 
CTGATCGATC TTCAGACCGC CGACATACGG GACTACACCC GAGCGTTGGT GGATTTCCGG 
CCGCAGACCG TGATGTTCGG CCTGAATTAC CTGGCCAACG TCCCAGAAGT CATCATGCTC 
GCGAAACAGG CCAAAATCAC CCGGCCAGGA TGTTTGGTGA TCGCCGGTGG TCACAGCGTC 
TCGTTCATCG CCCAGCACCT CCTCGAGAAC TGCGACGAAG CAATCGATGC GGTGGCCCGG 
GGAGAGGGCG AGGTCGTCGC TCCCCGGATC CTCGAAGCCG ACTGGGACAG CCTCACCGAG 
GTCCCGGGAG CGGTCACCCG CGCCGGGTCC GGGCCCCCGC CGACCATGCT GCCCACCCTC 
GACGAGCCGC TCCCGGCCCG TTACCTGCTC GCCCGCCGCA ACCGGTACTT CATCGGCGAG 
CTCGACCCGT GTGCATCGGT GGAGTTCACC CGCGGCTGCC CCTGGGACTG CTCGTTCTGC 
AGTGCCTGGA CGTTCTACGG GCGCAGCTAC CGGCGGATGT CGGCGGACGC GGCCGGACAC 
GAACTCGCCT CCATCCGCGA GCCCAACGTC TTCCTCGTCG ACGACGTGGC CTTCATCAAA 
CCCGACCACG GCAATGCCAT CGCCGACCAA ATCGAACGCC GCGGCATCCG AAAGCGCTAC 
TACCTGGAGA CCCGCGCGGA CGTCCTGCTG CGCCATCCCG AGGTCTTCCA ACGCTGGCGC 
CGGCTCGGCC TGACCTACAT GTTCCTCGGC ATGGAGGCCC TCGACGCCGA GGGACTCGAC 
CTGTTCCACA AGCGCATCTC CCCCGACGAG AACATCAAGG CCCTCGAACT CGCCCGCAAG 
ATCGGCATCA CCGTGGCGGT GAACCTCATC GCCGACCCCG CCTGGAGCCG TGACCAGTTC 
CGGCTGGTCC GACAATGGGC CCTGTCCGTA CCGGAAATCG TCCACCTGAC CGTCATGACG 
CCCTACCCGG GCACCGAGAT CTGGCACACC CAGTCCCAGA AACTGACCAC GCTGGACTAC 
CGCCTGTTCG ACATCCAGCA CGCGGTCACC CCGACCAGCC TTCCCCTCGA CGAGTTCTAC 
CGCGAACTCG TCGCGACCCA GGCCGTACTG AACCGCAAGC ATCTCGGCGT CAAGGCACTG 
GCCGCTACCG CACGTATCGT CGCCGGGCAT CTCACCCACG GTCAGACGAA CTTCCTGCGC 
ATGCTCTGGA AGTTCCCACG GGTCTACAAC GCCACGCGGC TCCACGCCGA ACACGGCCAG 
CCCGCCCGCT ACTGTCTGCC CGCACCGACC CACGCAGGGG TGAGCCGCCG GCGACGCGAG 
CTGTACATTC ACCAGCCTAT TTAG

Protein sequence

MRVLLVHPSA LMYSEIFLRL EPLGLERVAA SLLMAGHEVR LIDLQTADIR DYTRALVDFR 
PQTVMFGLNY LANVPEVIML AKQAKITRPG CLVIAGGHSV SFIAQHLLEN CDEAIDAVAR 
GEGEVVAPRI LEADWDSLTE VPGAVTRAGS GPPPTMLPTL DEPLPARYLL ARRNRYFIGE 
LDPCASVEFT RGCPWDCSFC SAWTFYGRSY RRMSADAAGH ELASIREPNV FLVDDVAFIK 
PDHGNAIADQ IERRGIRKRY YLETRADVLL RHPEVFQRWR RLGLTYMFLG MEALDAEGLD 
LFHKRISPDE NIKALELARK IGITVAVNLI ADPAWSRDQF RLVRQWALSV PEIVHLTVMT 
PYPGTEIWHT QSQKLTTLDY RLFDIQHAVT PTSLPLDEFY RELVATQAVL NRKHLGVKAL 
AATARIVAGH LTHGQTNFLR MLWKFPRVYN ATRLHAEHGQ PARYCLPAPT HAGVSRRRRE 
LYIHQPI