Gene Slin_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_0447
Symbol
ID	8724175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	555935
End bp	557116
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	48%
IMG OID
Product	Lycopene beta and epsilon cyclase
Protein accession	YP_003385310
Protein GI	284035380
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT ACGACTTCAT CATTGCCGGA GGAGGCATGG CTGGTTTAAG CCTTGCCTAT 
TATCTTAGCC AGTCACCGCT GCGGAATCAT AGCATTTTGA TTCTTGACCG GGAAATAAAA 
AACAGCAATG ACCGGACCTG GTGTTTCTGG GACCGGAAAA AGGGCGTTTC GGGCCGCGAA 
CCGGCGCGTA TGAACGCCTT TGAGTCAATT CTTTTCCGTA CCTGGAGCAA AGTGAGCTTT 
CATGGAACAA CCCATGCCGG GCTGCTGGAT ATGGGGCCGT ACGACTACAA GATGCTGCGC 
GGCATAGACT TCTACGAATT TGTTCAGCGC GAACTGGCCA ATCATCCGAC AATTGAACGC 
AGGCAGGCAA CCATCAACCG TATTAAAGAT ACCCCGCAGG GTGGATTCGT TATTGCGGAT 
GATGAACCAT ACATTGCCGA CTACGTATTC GACAGCACCT TTTCCCTCAA ACTGGATCAA 
TCCGAAAACC ATAACCTGCT CCAGCATTTC AAGGGATGGG TCATCACCAC GGAGAAGCCG 
TGTTTTAATC CGCATGAGCC CGAAATAATG GACTTTCGAA TCCATCAGCA TGGCGATTGC 
CGGTTCGTGT ATGTACTGCC TTTCACGGAA AAATCGGCAC TGGTTGAGTT TACCCTCTTC 
AATGATAAGC TGTTATCTGA ACCAGAATAC GATCTTGAAA TCCGCAATTA CATCGCCCAA 
TTCCTGAATA CCGGAGCTTA TGAAATAAGC GAAACAGAGT ATGGCGTTAT TCCCATGTCG 
GACGAAGCAA CGCAGGAGAA TCCGTCAGAA CATATTATTC GGATTGGCAC ATCCGGCGGA 
TACACAAAAC CCTCGACCGG GTATACCTTT CAGCGAACCC AGCGCTACTT GCAGAGCATT 
GTCGATAATC TGGTACAAAC CGGCAAACCC CAACGGCCTG TAAGCTGGTT GAAAAAGCGG 
TTTAAACTTT ACGACAGTAT CTTCCTGAAC GTACTCGAAA AGCACCGCCA TCCGGCCGAC 
GACATCTTTA CGAGGGTCTA TGCCGGCAAT CCCGGACGCG TTTTCACTTT TCTTGATGAA 
GAAACACGCT TTATCGACGA GCTGAGGTTG TTTGCCACGA TGCCGTTTAT GCCATTTCTT 
AAGGCTTTGT TTGACGTAAT ACGTCGGAAG CTATTCGGTT AA

Protein sequence

MKKYDFIIAG GGMAGLSLAY YLSQSPLRNH SILILDREIK NSNDRTWCFW DRKKGVSGRE 
PARMNAFESI LFRTWSKVSF HGTTHAGLLD MGPYDYKMLR GIDFYEFVQR ELANHPTIER 
RQATINRIKD TPQGGFVIAD DEPYIADYVF DSTFSLKLDQ SENHNLLQHF KGWVITTEKP 
CFNPHEPEIM DFRIHQHGDC RFVYVLPFTE KSALVEFTLF NDKLLSEPEY DLEIRNYIAQ 
FLNTGAYEIS ETEYGVIPMS DEATQENPSE HIIRIGTSGG YTKPSTGYTF QRTQRYLQSI 
VDNLVQTGKP QRPVSWLKKR FKLYDSIFLN VLEKHRHPAD DIFTRVYAGN PGRVFTFLDE 
ETRFIDELRL FATMPFMPFL KALFDVIRRK LFG