Gene Slin_2843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_2843
Symbol
ID	8726593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	3438076
End bp	3439200
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	53%
IMG OID
Product	oxygen-independent coproporphyrinogen III oxidase
Protein accession	YP_003387656
Protein GI	284037726
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.225724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.624237
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCTCT ATCTTCACAT ACCGTTCTGC AAACAGGCCT GCCATTATTG CGACTTTCAT 
TTCAGTACAA GTCTGGGGCA GAAGTCGGCC CTGGTTGATG CGCTTTGTAC GGAAATTGCC 
CTGCAAAAAA GCTACCTGCC CGATCAGGCA CTGGAAACGA TTTATTTTGG CGGAGGCACA 
CCTTCCCTGT TGACAGAGGC TGAGTTAGCA CAGGTTTTTA CCGCTATTCA CGCTCATTTT 
TCAGTTTCAC CAACCGCCGA AATCACCCTT GAAGCCAACC CCGATGATCT TGATTCTGGG 
AAGCTTCAGA TGTTGCGTCG CTATGTTAAC CGGCTCAGTA TTGGGATTCA AACGTTCGAT 
GAAACTTCGC TCCGCTGGAT GAATCGTGCG CATACTGCTA CGGAAGCCGA AGTATGCGTT 
GGGCTGGCGC GGCAAGCGGG ATTTGAGAAT ATGAGCGTTG ACCTGATTTA CGGAATTCCG 
AATAGAGACA ATCAGGCGTG GCAGCTTGAT TTGCAAAAAA TACTGGCACT CAACGTGCCC 
CACCTCTCGG CTTATGCCCT GACGATTGAA CCCGACACCG CTTTTGGGCG CTGGCAGAAA 
AAAGGGAAAT TGCCTCCTGC TGATGAGGAC ACTGCCGCCG GTCAATTTGA GGAGTTAACA 
AGTGCGCTGA CAACGGCAGG CTACGCCCAC TACGAAATAT CGAACTTTGC GCGGGATGGC 
CAGTACGCCC GGCACAACAC GGCTTATTGG CAACGGCGGC CGTACCTGGG CATCGGGCCA 
AGTGCTCATT CGTACAATGG CCACTCGCGA CAATATAACC TGGCCAATAA TGTCCGTTAC 
ATCGCAGCGA TTGCCCAGGG AAAACTTCCC GCCACGCTGG AGGAACTGAC CGTTGCCGAT 
CAGGTCAATG AATACCTGCT GACTGGTTTG AGGACCCAGT GGGGCTGCTC CCTGACGGAA 
CTTGATACGA TGCTGGCGGG CGATTTTTCG ACGATGCAGG CCCGCGATCT GGCCGCTATG 
TACAAAACCG GCTGGCTGGT TCGGCATGGC GATACACTTC TGCTGACTCA GCCCGGTAAA 
CTCTTTGCTG ATCGGGTGGC CGCTTCCTTA TTCGTAGACG CGTAA

Protein sequence

MHLYLHIPFC KQACHYCDFH FSTSLGQKSA LVDALCTEIA LQKSYLPDQA LETIYFGGGT 
PSLLTEAELA QVFTAIHAHF SVSPTAEITL EANPDDLDSG KLQMLRRYVN RLSIGIQTFD 
ETSLRWMNRA HTATEAEVCV GLARQAGFEN MSVDLIYGIP NRDNQAWQLD LQKILALNVP 
HLSAYALTIE PDTAFGRWQK KGKLPPADED TAAGQFEELT SALTTAGYAH YEISNFARDG 
QYARHNTAYW QRRPYLGIGP SAHSYNGHSR QYNLANNVRY IAAIAQGKLP ATLEELTVAD 
QVNEYLLTGL RTQWGCSLTE LDTMLAGDFS TMQARDLAAM YKTGWLVRHG DTLLLTQPGK 
LFADRVAASL FVDA