Gene GSU1010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1010
Symbol
ID	2687460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1091283
End bp	1092803
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	60%
IMG OID	637125680
Product	Slt family transglycosylase
Protein accession	NP_952064
Protein GI	39996113
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0741] Soluble lytic murein transglycosylase and related regulatory proteins (some contain LysM/invasin domains)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCGAT CTTTTTTCCT GCTGGCCATA GTCCTGCTGT TTACACCCAT TGCCCAGGCA 
TCCGATCTTC ACTTGAACCC CCTGCGGGAG TTGACCTCCC TGGGGAGCGG TTCGCTGCAG 
GCCGATCTGT CGGGAGTTGT TCCCCGCGTG GGATCGGCGC GGCCAAAGGC TGCCTCCCCT 
GCCGAGGGGC GCCGGGCGAA TCCGCTGGAG CCGTCCATGG GAGAGCTCAT CGTCGTGGAG 
GACGAGACAT CCCTTGAGGA TGATTTCGAA CTGCAGCTCC CCGGCCAGGA CCTCCCCGAA 
TCGGACATCC CGCTTGCCCT CAACGGCAAG GTAGAGTACT TCATCTCCTA TTTCCAGACC 
TCCGGCCGCA AGTCCTTTTC CCGCTGGCTT TCCCGCTCCG AACGATACAT TCCCATGATG 
CGCGAGGTTC TCAGGAAGGA AGGACTTCCC GAGGATCTGG TCTACCTGGC CATGATCGAG 
AGCGGCTTTA CGCCCCATGC GGTTTCCGTG GCGAGCGCCG TGGGCCCCTG GCAGTTCATC 
TCGGGCACGG GAAAACGTTA CGACCTGAGG ATCGACCAAT GGATCGACGA ACGGCGCGAT 
CCGCTCAAGT CGACCGTTGC CGCCGCCATG TACCTGAAGG AGCTTTACTC CCTCTTCAAT 
CAGGATTGGT ATCTGGCTGC GGCAGGCTAT AACGCCGGCG AGAACAAGAT CCTGCGCGCC 
ATCGACAAAT ACAACACGCG GGACTTCTGG GAAATATCCA AGGGCTCGTA TTTGAAGAGG 
GAGACCAAGG ATTACGTGCC GAAGCTCCTG GCCGCCGCCA TCATCGCAAA GGAGCCGGCC 
CGCTACGGCT TCGCCGATGT GGCGTATCTT CCCCCCATCG AGTTCGACTT AGTTGCCATT 
CCTTCGCGCA CCGATCTGGA CCTGGTGGCC AAACTCTGCG AGGTGGATGT CAAGGCCATC 
AAGGAATTGA ACCCGGAACT GCGCCGCTGG TGCACACCTC CCGACTACCC CGACTACGAG 
CTCAAAATCC CCAAGGGAAA GCGCACGTCC TTCGAGGAGG CATACGCCCA TCTCCCCGCG 
GACCAGCGCT ACGTCGAGCG GATTGTCTAC AGCCGCTACC GGGTTAAGAA AAAGGATACC 
CTGCAGGCGA TCGCGCGACG CTACGGCACC ACTGCCGAGA CCCTGGCCGA GGTTAACAAA 
CTGAAGCCGA CCTCGAAGCT CCGGGGCCGC ACCCTGCTGG TGCCGGTGCC GGTCGCGACG 
GAGGATGCCG CGGAAAGGAC CGTCGCCAAG GCGTCGCCGA AGAAGGACGA GTCCCGCGCA 
TTCAACAAGT ACTACACGGT CAAGAAAGGC GACACCGTCG CCTCGCTGTC CAAGAAATTC 
AACATTTCCC AACGGATTCT GGCAGCATGG AATAATTTGA AGGGCAAAAT GGCCCTTCAC 
CCCGGCAAGC GGATCATCGT CGCCAAGTAT GTGGAGAAAA AAGGGTCGAT GGTGCCGGTC 
GACGGCGGGG AGAACAGCTA G

Protein sequence

MNRSFFLLAI VLLFTPIAQA SDLHLNPLRE LTSLGSGSLQ ADLSGVVPRV GSARPKAASP 
AEGRRANPLE PSMGELIVVE DETSLEDDFE LQLPGQDLPE SDIPLALNGK VEYFISYFQT 
SGRKSFSRWL SRSERYIPMM REVLRKEGLP EDLVYLAMIE SGFTPHAVSV ASAVGPWQFI 
SGTGKRYDLR IDQWIDERRD PLKSTVAAAM YLKELYSLFN QDWYLAAAGY NAGENKILRA 
IDKYNTRDFW EISKGSYLKR ETKDYVPKLL AAAIIAKEPA RYGFADVAYL PPIEFDLVAI 
PSRTDLDLVA KLCEVDVKAI KELNPELRRW CTPPDYPDYE LKIPKGKRTS FEEAYAHLPA 
DQRYVERIVY SRYRVKKKDT LQAIARRYGT TAETLAEVNK LKPTSKLRGR TLLVPVPVAT 
EDAAERTVAK ASPKKDESRA FNKYYTVKKG DTVASLSKKF NISQRILAAW NNLKGKMALH 
PGKRIIVAKY VEKKGSMVPV DGGENS