Gene Tcr_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_2049
Symbol
ID	3761966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	+
Start bp	2261574
End bp	2262974
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	44%
IMG OID	637786798
Product	hypothetical protein
Protein accession	YP_392313
Protein GI	78486388
COG category	[S] Function unknown
COG ID	[COG2340] Uncharacterized protein with SCP/PR1 domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.670502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGATTC GATTACTGTT ATATTTTATG CTCGGGCTGT TTCTGATCTG GTTTTTCAAT 
GGTGGTATGG AAAAAATAAT GACCCCACCC AGTGACCTTT CCAGCATTCC TGAACAACAG 
AAACCTTATC AAAAAATACC TGTCGCGAAG CCGCTGACGC CTTCCATGGT GGAAGCTCAG 
GAACGCGAAG CCATGCTTTA CTTGAATCGC ATTCGCCAAA GTGTGCAACT CACACCTTTA 
CAATATCAAG TGGCACTGTC AAATGCCGCG CGTCATCACG CAAACTATTC TTCACTCAAC 
AATCTTCAAA GCCATGAAGA ACAGTCCAAC CTGCCTGCTT TCAGCGGGAA AACACCCACA 
GATCGCGCTT TTAATGCAGG CTATCAGAGT CCGGTTGCCG AAGTCATTGC ATATAACCAC 
CATCGCCCTC ACCCGTTTAT TGATGACTTG ATGTCAGCAA TCTATCATCG CCTGTCTTTA 
TTAGACATGA CCAAAGATCA AATCGGTGTT GGCATCGCAG GCAATGGCCA AGGCTCAGTC 
AATTCAAGCT TAACGGCTTT ATTGGGGAAT CAAGCATTAA ATGATTTATG CCAAACGCCT 
CCTTCTCCTA AACCAGGAAC TTATTACTAT CAGGACGTGT GTCAAAATGA TCGTCCTATT 
TCAAAACGTG ATTACGACAA AGCCTTACAC CAAGTAGCAA AACAAAACCC CAAACTGATT 
ACCTGGCCCA AGCTAGGCGG AGAAGTTTCT CCGGTTTTCT ATGAAGAATC GCCTGATCCA 
TTACCGGAGT GCAATGTTTC AGGTTACCCA ATTCATTTAC AAATCAATCC GATTTATGCT 
GGCCGCATAA CGTTTCTAAA TGAAACCTTT AAAGTCTTTG AGCTGAAAAA CGGCGAAACC 
CTTCCTGTTG TCGCCGAAAC CATTTTTGAC AATCAAAGCA ACCCTGTTAC CGCGCTGAAC 
GCCTCCGAAA TGCTCCCAAA CGCCTCTTCT AAAAAAGATC GATGGATTGC CTTTTTTCCA 
AAACACCGTT TGAACTGGAA CAGCCAATAT CAAGCCGAAA TTCAATACAA AGAAGATGGG 
CAACGCAAAA CCCAACGCTG GCAATTCACA ACCCAAAATC AGCCAGGCCT GGTTACTTTT 
TCGGCTGACA AAAAGCAAAA GCAGACGCTT AAAATTAAAA AAGGGCAAAC CTACACACTG 
TATTTTCCGC CCAACCAGTG CAAAATGGCG TCAACCATTG TGATGCGCAA ACAAATTCCT 
AAATCGATCG ATGTCAGCAG CCGTTTTATT GATGGTGAAA CCATTCAGGT TACATTGAAT 
GCGGCTCCGT TTGGTGGTGC TTTTTCCATT GCCTATGGCC CCAGCCAAAC CTTGATACGG 
TTTGAAATTG AAACCGATTA G

Protein sequence

MLIRLLLYFM LGLFLIWFFN GGMEKIMTPP SDLSSIPEQQ KPYQKIPVAK PLTPSMVEAQ 
EREAMLYLNR IRQSVQLTPL QYQVALSNAA RHHANYSSLN NLQSHEEQSN LPAFSGKTPT 
DRAFNAGYQS PVAEVIAYNH HRPHPFIDDL MSAIYHRLSL LDMTKDQIGV GIAGNGQGSV 
NSSLTALLGN QALNDLCQTP PSPKPGTYYY QDVCQNDRPI SKRDYDKALH QVAKQNPKLI 
TWPKLGGEVS PVFYEESPDP LPECNVSGYP IHLQINPIYA GRITFLNETF KVFELKNGET 
LPVVAETIFD NQSNPVTALN ASEMLPNASS KKDRWIAFFP KHRLNWNSQY QAEIQYKEDG 
QRKTQRWQFT TQNQPGLVTF SADKKQKQTL KIKKGQTYTL YFPPNQCKMA STIVMRKQIP 
KSIDVSSRFI DGETIQVTLN AAPFGGAFSI AYGPSQTLIR FEIETD