Gene Sbal223_4072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_4072
Symbol
ID	7089690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	4832725
End bp	4833684
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	46%
IMG OID	643462950
Product	biotin--protein ligase
Protein accession	YP_002359968
Protein GI	217975217
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0340] Biotin-(acetyl-CoA carboxylase) ligase
TIGRFAM ID	[TIGR00121] birA, biotin-[acetyl-CoA-carboxylase] ligase region [TIGR00122] BirA biotin operon repressor domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.228403
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATA ATTGGGGAAG AAAGCGCCAG ATATTAGCGT TATTGTCTAG CGGTCAATTT 
ATTTCAGGCG AGCAGTTAGC CACAGAACTT GGGATTTCGC GCGCCGCTGT AAATAAGCAT 
ATTGATGCGT TAGAAACCTA TGGTGTGGCA ATTTATAGCG TTAAAGGTCG CGGCTATAAG 
CTAGCCAATC CCATCTCTTT GATTGATGCT TCACGTTTAG TGCAGTCAAT TGATAACCGT 
TGTTTTTATT TTGATGAGAT CGCAAGTACC AACGGCTTTA TGCTGAGTCA TACCACTGAG 
CTAAAAAATG GCGATGTGTG CGTGGCAGAG TACCAATCTG CAGGTCGCGG TCGCCGAGGT 
CGCACTTGGG TGTCGCCCTA TGGGCATCAC TTGTACTTCT CATTGTTTTG GACATTCCCG 
CAGGGAATGG CACAGGCCAT GGGTCTAAGT TTAGTGGTGG CGTGCACTCT AGTTGAAGTG 
CTTAAATCGT TTGGGGTCGA GAATATTGGG GTTAAGTGGC CGAATGATAT CTATTTGGAT 
AACAAGAAGC TTGCCGGGAT CTTGATTGAA ATGTCGGGAC AGGTGGATAG TCAGTGTCAG 
CTGATCATTG GTGTTGGCGT TAATATGGCG ATGTCAGATG AGCAAGGCAA AGGTATCGAT 
CAGCCTTGGA GTGACCTGTC AGAGTTGGTC GATATGCCAG ATAAGACCGC GCTTGTCATT 
GAATTACAGA AGCAGCTAAA GCGTGATATC CAGCTATTTG AACGTGAAGG ATTAGCTGCA 
TTCAAGGCTC GTTGGCAAGC AGCGGATCTA TTTTTTGGAC GTGAAATTCG GTTATTAATG 
GCTGATAACT TTGTGGATGG TATTTGTCGT GGTGTTGATG AGCAGGGGGC GGTATTGCTC 
GAAACCGCCG ACGGTATGCA AGCATTTATC GGCGGTGAAA TTAGCTTAAG AGCGCGCTAA

Protein sequence

MSDNWGRKRQ ILALLSSGQF ISGEQLATEL GISRAAVNKH IDALETYGVA IYSVKGRGYK 
LANPISLIDA SRLVQSIDNR CFYFDEIAST NGFMLSHTTE LKNGDVCVAE YQSAGRGRRG 
RTWVSPYGHH LYFSLFWTFP QGMAQAMGLS LVVACTLVEV LKSFGVENIG VKWPNDIYLD 
NKKLAGILIE MSGQVDSQCQ LIIGVGVNMA MSDEQGKGID QPWSDLSELV DMPDKTALVI 
ELQKQLKRDI QLFEREGLAA FKARWQAADL FFGREIRLLM ADNFVDGICR GVDEQGAVLL 
ETADGMQAFI GGEISLRAR