Gene Sbal223_1303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_1303
Symbol
ID	7089866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	1540456
End bp	1541598
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	47%
IMG OID	643460207
Product	transglutaminase domain protein
Protein accession	YP_002357234
Protein GI	217972483
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.403098
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.79746
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAGAC GCAATTTTTT AAAAAGTGCG GCTATTTTGT CGACTGCGGG GTTTATCACG 
CCGGTACTGG CATCTTCCTC TAAATCGAGT GTCGTTGAAC CTAGCTCAAG TGATGGACGT 
CGCCGTTTTA TCTTAACCAA CACTTACCAT CTTGTTGCTC CTGAAGGCTC TGAGGGCGTG 
GTTAAGTTGT GGATCCCTTT GCCTGAAGAC ACGCAATTCC AACGGGTCAG TAAGCTGAAT 
TTCACCGGCA GTTTTAAAGA TGCCTATATC AGCTCAAACA ACAGTTATGG CGCTAAAACG 
CTGTTTGCGA CTTGGCCAGA TGCCAAAGAC AGCATGACAA TGACCGTTGA GTTAGACATT 
GAAACCTTAG ATTGGGAACC GGTTAAAAGC GGCGCTTTGA CTCACTATCG CACACCAACA 
CAGATCCACT ATCCTGCAGA TGTAGAACGT TATTTACTGC CGACTAAACA TATGCCGATT 
AACGGTATTG TGAAGCAAAC GGCGGATAAA ATCGTCGGTA GCGAAACGGA TCCACTGAAA 
CAAGCGCGAC TGATTTACCT TTGGGTTAGT GCCAATATGT TCCGTGACAA TAGTGTGATT 
GGCTGTGGTA CAGGTGATGT GGCCAGCATT TTAGAAAGTG GCAAGTTAGG CGGTAAGTGT 
ACCGACATTA ACTCGGTATT TGTGGCGTTA ATGCGCGCTG TGGGTATCCC TGCCCGTGAA 
ATGTTTGGCA TTCGCTTAGG TCAGGCGATC AAGATGGGTC ATTATTCTAA AAAGGCCTTT 
GGGAGCGCCG ATGACAAAGG GGCTGCCGAT GTTAGTGGCG GTCAACATTG CCGCGCTATG 
TTCTATTTAG CGGGTTATGG TTGGTTGCCA GCCGATCCTG CCGATGTGAC TAAAATGCGC 
TTAACAGAGA AAAAAGAACA CAGCGATCCT GCGGTTCAGG CAGTGAATGA TTACCTCTTT 
GGTAACTGGG AAATGAACTG GGTTGGCTTT AACTATGGTC GCGACTTTGA TTTATTCCCT 
GAAGCCGAGC AGACACCACT GAATAACTTT GGTTATCCCT ATGCGGAAGT CGATGGCGAT 
CCTGTGAATT ATTATGAACC AAAAGTGTTT GCCTATGACT ACCAGTCAAC CGAACAACGC 
TAA

Protein sequence

MQRRNFLKSA AILSTAGFIT PVLASSSKSS VVEPSSSDGR RRFILTNTYH LVAPEGSEGV 
VKLWIPLPED TQFQRVSKLN FTGSFKDAYI SSNNSYGAKT LFATWPDAKD SMTMTVELDI 
ETLDWEPVKS GALTHYRTPT QIHYPADVER YLLPTKHMPI NGIVKQTADK IVGSETDPLK 
QARLIYLWVS ANMFRDNSVI GCGTGDVASI LESGKLGGKC TDINSVFVAL MRAVGIPARE 
MFGIRLGQAI KMGHYSKKAF GSADDKGAAD VSGGQHCRAM FYLAGYGWLP ADPADVTKMR 
LTEKKEHSDP AVQAVNDYLF GNWEMNWVGF NYGRDFDLFP EAEQTPLNNF GYPYAEVDGD 
PVNYYEPKVF AYDYQSTEQR