Gene Franean1_4481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4481
Symbol
ID	5672831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5346623
End bp	5348143
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	64%
IMG OID	641243348
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001508764
Protein GI	158316256
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAATA GCACCAGGAG TCCCGCATCG TTAGGTCGGA CGTTGCTTGC GATAGCTGCT 
GACCGGCCAG CTCACCCGGC GGTAACCACC CGGTCGGGGT CGACTTCCTA CCGGGAGCTG 
GCGGACGGTG CGCTGCGCGT CGCGGCAGCA CTGACGGTGC AGGGGCTCGG TCTTGGCGAC 
CGAATAGCGA TCCTGGCTCG TAACGATCTA CCCTACGTCG AGCTCATCTA CGGCGCGGAC 
TTTGTCGGTG CGGTGGTCGT CGGGATCAAT TGTCGGCTCT CGCCGGCGGA GGTTGCCGAT 
ATTCTCGACG ACTGCCAGCC CAGCCTTGTG TTCGTCGCGG ACGAGTACCT GCCGCTGCTG 
GGTTCCGCCG CCGCGGGCGT CCTCCGGGTG TCTCTTGATC GCGACTACCG GACATGGTGC 
GGCACCGGGG ACATGACGCG GTTCGTGCCG CGGGTCGGTT ACGCCGACAG TGTGGTACTC 
ATGGTCTACA CCAGCGGCAC CACCGGTCGG TCGAAAGGTG TGCGACTGAC CGAGGCCAAC 
ATCACGGCCG CCCTCGCCGC GAACAGAGAT GTCTGGTTCG TTGGCCCGGA GATCCGGGCG 
CTGGCGCTTT TTCCGCTGTT TAATATCAGC GGTTCGATCT TTCTGCTCTC GATCTTACAT 
GTCGGCGGTG AAGTCGTCAT TGCCGAGAAC GCGTCAGGCG CCACCATCCT GGAACTTCTC 
GGGGCGAGGC GCATTACCCA CGCGCTGTTC GTGGCGGCGA TGATCGTCGC GCTGCTTGAT 
CAACCGGCCG ACGACGAGAT CGACCTGTCC AGCCTGCGAG TACTGATCTA TGGTGCCGCT 
CCGTCTTCGG CGGCCGTGAT CGACCGGGCT ATGCGGCGGC TGCCGACCTG TGATTTCTTT 
CAGGGATACG GGATGACGGA GACCTGTGGC GGCATCGCGA TGACGCCGCC GCATCGATAC 
GGCGAAGAGA TCGCGCCGGC ATCGGTGGGG CGAGCCATAC CATCCTATGA GATTCGGATT 
GTGGATCCGG TCAGGCGCAC CGACCTGCCG GTTGGTGTGG AAGGCGAGAT CTGGGCGCGC 
GGGCCACAGA ACACCATCGG CTACTGGAAC CGGGCCGAGG AGACCGATCG TCTGCTCGCC 
GCGGACGGGT GGCTTCGTAC CGGTGATGTC GGTGTCCTAG ACGCCGCTCA CAACCTCTAT 
GTCGTAGACC GCCTCAAAGA CATGATTATT TCGGGTGGGT TCAACGTCTA TTCGCTCGAG 
GTCGAGCAGA TCCTGGTCGG CCACCCGGAT GTCGGTGATG CGGCGGTGTT CGGCGTGCCC 
GACGAGCGTT GGGGCGAGAC CGTGGTGGCC GTGGTGACCC TGCGTCCGGG CGCCACCTGC 
GTCCCGGCCG ACCTGAGTGA GTTCGCCCGG GCGCGGTTGG CCCACTTCAA ATGCCCGCGG 
CGGATCGAGA TTCTCGACGA ACTTCCGAGG AATGCGGCCG GAAAGATCCT CAAAAGAGAG 
CTTCGCGGCC GGTTCAGCTG A

Protein sequence

MTNSTRSPAS LGRTLLAIAA DRPAHPAVTT RSGSTSYREL ADGALRVAAA LTVQGLGLGD 
RIAILARNDL PYVELIYGAD FVGAVVVGIN CRLSPAEVAD ILDDCQPSLV FVADEYLPLL 
GSAAAGVLRV SLDRDYRTWC GTGDMTRFVP RVGYADSVVL MVYTSGTTGR SKGVRLTEAN 
ITAALAANRD VWFVGPEIRA LALFPLFNIS GSIFLLSILH VGGEVVIAEN ASGATILELL 
GARRITHALF VAAMIVALLD QPADDEIDLS SLRVLIYGAA PSSAAVIDRA MRRLPTCDFF 
QGYGMTETCG GIAMTPPHRY GEEIAPASVG RAIPSYEIRI VDPVRRTDLP VGVEGEIWAR 
GPQNTIGYWN RAEETDRLLA ADGWLRTGDV GVLDAAHNLY VVDRLKDMII SGGFNVYSLE 
VEQILVGHPD VGDAAVFGVP DERWGETVVA VVTLRPGATC VPADLSEFAR ARLAHFKCPR 
RIEILDELPR NAAGKILKRE LRGRFS